中国·澳门新葡萄新京威尼斯(987-官方网站)-Ultra Platform

/ EN
13922884048

技术交流

Technology Exchange
/
/

AI/ML网络高速铜缆连接与趋势

发布时间:2024-09-14作者来源:澳门新葡萄新京威尼斯987浏览:1226

图片


近年来,随着技术的发展和应用场景的拓展,人工智能 (AI) 和机器学习 (ML) 成为热门的话题,但许多人往往将它们混淆使用,甚至认为这两个概念完全相同。我们从定义、算法、应用等方面详细剖析二者之间的联系与区别。

人工智能AI: 是一种计算机科学,注重研究能够像人类一样思考和行动的计算机程序的设计与开发。该领域通常被认为与机器语言、机器学习和自然语言处理密切相关。

2 机器学习ML: 是人工智能AI的一个分支,它将数学和统计学领域中的方法应用到计算机科学中,通过让计算机从数据中学习,使得计算机不需要明确编程来执行特定任务。换句话说,机器学习是人工智能的一种特殊应用。

人工智能所采用的算法非常多样化,包括基于规则的推理、决策树、深度学习、神经网络、进化算法等。在这些算法中,深度学习和神经网络模型应用最为广泛。机器学习的算法类型包括监督式、无监督式和强化学习。其中,监督式学习是一种使用标记数据来训练算法的方法,无监督式学习是一种从未标记或少量标记数据中进行训练的方法,强化学习则是通过执行动作来获取反馈来训练智能代理。

人工智能的应用领域非常广泛,包括自然语言处理、计算机视觉、机器人学、游戏等。在实践中,AI可应用于医学、金融、安防等众多领域。机器学习的应用范围同样广泛,其中最常见的应用就是大数据分析、图像识别、语音识别、语言翻译、自然语言处理等方面。在商业领域中,机器学习的应用越来越多,如金融风险评估、制造业预测、销售预测等。人工智能和机器学习都旨在让计算机更加智能化。机器学习属于人工智能的一个分支,并且它的算法,比如监督式学习、无监督式学习和强化学习等,是建立在 AI的基础上的。人工智能则不仅包括了机器学习,还包括了其他的算法模型。因此,可以说人工智能是机器学习的一个更为广泛的概念。分别应用于不同的领域,且都具有不同的算法和技术。但是,它们之间有一定的关联性,机器学习是人工智能的一种具体实践方式,人工智能的多个领域都涉及到了机器学习。

以太网于AI/ML网络中作用

以太网协议实现了局域网LAN、广域网WAN、互联网、云计算、物联网设备及Wi-Fi系统的全球性无缝通信网络整合。作为网络技术的先驱之一,以太网自诞生以来已历经半个世纪。得益于其部署的简便性及在保持向后兼容性的同时融合现代技术的能力,以太网持续稳固其作为计算机网络领域的标准地位。随着人工智能工作量的日益增长,网络行业的领军企业正联手确保以太网网络能够适应并满足AI对高性能网络的苛刻要求。


图片


以太网的核心是一个使计算机设备(从服务器到便携式笔记本)能够通过有线网络进行互联的协议。这一网络依赖于路由器、交换机和集线器等设备来指导数据流动。以太网还能与无线通信协议无缝结合。以太网之所以能在全球范围内得到广泛应用,源于其能够适应几乎所有类型的环境。特别是它允许企业在其局域网和广域网中采用相同的以太网协议,这一点尤为重要。这意味着以太网不仅在数据中心、企业内部网络、互联网应用中表现出色,还能适用于包括虚拟私人网络VPN和软件定义网络SDN在内的复杂网络架构。


以太网轻松应对如视频流媒体和IP语音等带宽密集型应用。同时,其简洁性也使其能够与体积微小、功能相对简单的设备(例如构成物联网IoT的各类设备)兼容,无需进行特殊配置。

以太网是如何工作的?
以太网的运作方式是将发送至或自设备(例如个人电脑)的数据分割成称为“帧”的不同大小的信息块。这些帧包含了如源地址和目的地址等标准化信息,以协助帧在网络中正确地进行路由。

鉴于局域网中的计算机通常共享同一连接,以太网的设计基于载波侦听多路访问/碰撞检测(CSMA/CD)的原则。简而言之,该协议确保在发送任何帧之前,线路处于空闲状态。然而,在网络技术的早期,这一点比现在更为重要,因为现在的设备通常通过交换机或节点与网络建立各自的私有连接。由于以太网目前采用全双工模式运行,其发送和接收通道完全独立,因此在传输过程中不会发生碰撞。


除了在碰撞情况下,以太网并不具备错误纠正功能,因此通信过程需要依赖于更高级的协议来保证数据传输的准确无误。尽管如此,以太网仍是大多数互联网和数字通信的基础,并且能够轻松集成至多数高层协议中,因此在当今时代,这几乎不再是一个问题。

以太网核心组件:多彩电缆

在深入讨论以太网技术时,电缆是一个至关重要的组成部分。以太网最初采用同轴电缆,这种电缆也用于有线电视系统。同轴电缆因其坚固耐用和传输大带宽的能力而闻名。然而,它的重量大、操作复杂、缺乏灵活性且成本较高。这些限制导致家庭有线电视安装需要专业技术人员进行布线,与家用网络布线相比复杂得多。随着时间的推移,以太网逐渐摒弃了同轴电缆,转而采用了双绞线电缆,这种电缆至今仍然是有线网络的主流选择。双绞线电缆不仅成本较低,而且具有较高的灵活性,可以轻松穿越墙角、内墙、天花板或几乎任何其他地方,以连接服务器、路由器、集线器、设备和网络终端。更有趣的是,许多生产以太网电缆的公司已经抛弃了传统的灰色电缆,推出了多种颜色的电缆。这些彩色电缆不仅美化了服务器机房和数据中心,还通过颜色编码简化了网络连接的管理,有助于IT技术人员更直观地分组和诊断网络连接问题。

双绞线电缆的标准插头设计与有线电话系统的连接方式相似,因此电缆可以轻松[敏感词]任何支持以太网连接的设备。在大多数情况下,只需将设备连接到网络,即可立即实现网络连接。然后,以太网及其他高级协议(如生成树协议)会负责数据包和数据的后端路由处理。以太网电缆的长期标准被称为Category5,通常简称为Cat5。Cat5标准自2001年起一直在使用中,支持[敏感词]100Mb/秒的传输速度。虽然这些电缆的主要用途是支持以太网网络,但它们也兼容许多电话和视频应用。Category5e是一种更高级别的电缆类型,目前用于支持更快的以太网应用。Category5e电缆主要设计用于100Mb/秒的以太网,但它的结构也支持更高传输速度,如千兆以太网,并继续使用相同的通用连接端口。

谁发明了以太网?
最初的以太网标准是由施乐PARC的工程师Robert Metcalfe和David Boggs于1973年创立的,其设计灵感源自于夏威夷大学的ALOHAnet项目。按照当今的技术标准来看,这一系统相对原始,其原始传输速度仅为2.94 Mb/秒,但它标志着计算机首次真正实现网络互联的重要里程碑。在大学环境之外,公众直到1980年才有机会接触到以太网,那是施乐公司向公众开放以太网技术的时期。当时,已经存在如Token Ring、ARCNET等其他竞争性网络标准。但Metcalfe在离开施乐并创立3Com之后,成功说服了包括数字设备公司(DEC)、英特尔和施乐在内的多家行业重要企业,与3Com合作推动以太网成为统一的网络标准。作为这一合作协议的一部分,施乐放弃了对以太网名称的商标权,使得任何公司都可以在其产品中使用以太网技术。同时,以太网的带宽和吞吐量也提升至10 Mb/秒,这一速度远远超过了当时大部分网络任务的需求,留有充足的余地。这些因素共同促使以太网成为了全球范围内的主导网络标准。

以太网迎来50周年;Metcalfe获得图灵奖

2023年5月22日,以太网迎来了其成立50周年的纪念。在这一重要周年之前的几个月,即2023年3月22日,计算机协会向Bob Metcalfe颁发了享有盛誉的A. M. 图灵奖,以表彰他在发明及商业化以太网方面的杰出贡献。图灵奖附带100万美元的奖金,于6月10日在旧金山的颁奖典礼上正式授予。Metcalfe对1973年的那一天记忆犹新。“我当时坐在施乐PARC的34号楼内,使用Selectric打字机撰写关于网络应该如何运作的思考总结,并亲手绘制了相关图表。我使用Selectric上的Orator字球编写了这份备忘录,选择了无衬线字体,因为我偏爱那种字型。” 以太网的共同发明者Boggs于去年去世,Metcalfe对他们的伙伴关系怀有深切的怀念。“他和我就像Bobbsey Twins,”他在接受Network World采访时回忆道。“我们的合作非常互补;在我们两人中,我更擅长表达,而他更注重细节。我们共同打造了这一伟大的项目,我非常怀念他。他是我的好朋友。”

以太网的光明未来

以太网标准之所以能够随着技术进步而发展,得益于其简洁性以及在保持向后兼容的同时支持更高速度的能力。目前,几乎所有计算机或计算设备都能支持高达每秒一千兆比特(即1Gb/s,等同于1000 Mbit/s)的速度。这种通常称为千兆以太网的技术,与早期以太网支持的10 Mbit/s标准相比,其技术进步显而易见。对于家庭网络和大多数办公环境来说,千兆以太网已经提供了充足的带宽。在这种速度下,即便是带宽密集型的应用,如视频流媒体或在线视频游戏,也能在多用户同时使用同一网络的情况下流畅运行。然而,以太网的潜力远不止于此。IEEE以太网工作组几年前已经批准了200 Gb/s和400 Gb/s以太网的规范。主要是数据中心、互联网服务提供商(ISP)以及诸如网络运营中心之类的专业机构对这些高速度最感兴趣。一些云服务提供商等机构表示,他们正在某种程度上使用400 Gb/s的速度,尽管该标准的全面采纳似乎因新电缆要求(目前的Cat5和Cat5e电缆不支持这些速度)、设备向后兼容性问题以及数据中心内增加的功耗需求等因素而受到阻碍。技术上,800 Gb/s以太网的规范已经存在,但目前尚无人在测试环境之外使用。以太网之所以引人注目,是因为它作为一个开放协议,800 Gb/s的速度远未触及其理论上的[敏感词]极限。实际上,目前正进行研究,以为每秒1.6太字节的标准奠定基础。这样的超高速度可能仅在特定应用场景中才显得实用。例如,一个企业或政府机构可以利用这种速度快速地将其网络数据备份到远程位置。假设他们需要传输500太字节的数据,这一过程可以在不到14分钟内完成。

UEC联盟着手为人工智能  基础架构扩展以太网规模

随着人工智能(AI)工作负荷对网络提出前所未有的性能和容量需求,一些网络供应商联合起来,致力于提升以太网技术,以满足人工智能所需的规模和速度。2023年7月,由Linux基金会及其联合开发基金会倡议主办的超级以太网联盟(Ultra Ethernet Consortium,UEC)宣布正式成立,旨在为日益增长的AI网络互联生态圈提供强有力的支持。在2023年8月的IEEE Hot Interconnects(HOTI)国际论坛上,来自英特尔、英伟达、AMD等公司的代表围绕“EtherNET 还是EtherNOT”问题进行了小组讨论。当前,新兴的AI/ML工作负载正在推动对高性能网络互联的需求。大约十年前,基于融合以太网的RDMA (RoCE) 将低延迟的数据传输引入了以太网架构,但与其他网络技术相比,以太网在技术发展上略显滞后。随着以太网时代的到来,云厂商、设备商等各方面临关键的抉择。


UEC在其白皮书中指出,他们将进一步发展以太网规范,引入多项核心技术和功能,包括:

✔ 多路径技术和数据包喷射,确保人工智能工作流能够同时访问目标节点。
✔ 灵活的传输顺序安排,以优化以太网链路的负载平衡;仅在人工智能工作负荷在带宽密集型操作中要求时,才实施严格的顺序控制。
✔ 现代化的拥塞控制机制,确保人工智能工作负荷避免网络热点,并在多条路径上均匀分配负载。这些机制可与多路径数据包喷射技术协同工作,保障人工智能流量的可靠传输。
✔ 端到端的网络遥测技术,用于管理网络拥塞。网络传来的信息能够指示出拥塞的具体位置和原因。缩短拥塞信号的传递路径并为端点提供更多信息,有助于实现更加迅速有效的拥塞控制。
然而,当前以太网在满足AI工作负载需求方面仍存在差距。NVIDIA网络研究总监Larry Dennison指出,以太网的发展速度可能无法满足未来几年市场的需求。苏黎世联邦理工学院教授、微软大规模人工智能和网络领域的顾问Torsten Hoefler强调,以太网需要进化,以成为数据中心和超级计算机的未来。

从历史上看,InfiniBand和以太网一直在争夺AI/HPC市场的主导地位,它们都是开放标准。然而,目前InfiniBand仅由Nvidia作为单一供应商提供支持,而以太网则享有多供应商的支持,从而培育了一个充满活力和竞争的生态系统。但即使在选择以太网解决方案时,也可能会遇到自定义实现和供应商锁定的情况。AI/HPC网络可能会向一个新的、开放的、功能更强大的传输标准过渡,部分或完全取代ROCEv2 RDMA协议,这是超级以太网联盟正在追求的愿景。

AI/ML网络技术的综合选择分析

在AI/ML网络技术的选择上,各大科技公司展现了各自的策略,旨在平衡技术创新与商业利益:
◉亚马逊AWS:受InfiniBand RD协议启发,推出了SRD传输协议和增强型网络适配器(ENA),基于UDP优化网络,减少拥塞和延迟,同时维持其独特的AI/HPC网络战略。
◉谷歌:混合使用TPU和Nvidia GPU,部署高级“coherent”架构和基于MEMS镜像的光交换系统(OCS),提高数据中心的效率和性能。谷歌的AI/ML网络相对定制化,重点在于网络堆栈的创新和高效的数据处理。
◉微软:早期采用InfiniBand构建AI网络,同时探索基于UDP的True Fabric协议,以提高数据传输效率。微软的策略体现了对InfiniBand开放性的拥抱,以及对Nvidia全栈AI/ML解决方案的支持。
◉Meta:部署大型GPU集群,结合DLRM模型和PyTorch生态系统,实现基于以太网和InfiniBand的高效AI/ML集群。Meta的策略旨在推动AI技术的“民主化”,通过开源方法和硬件创新,加速AI应用的普及和创新。
◉Oracle:坚定支持以太网,利用Nvidia GPU构建基于ROCEv2 RDMA的高性能集群,展现了其在AI/HPC网络解决方案方面的专注和创新。
◉Nvidia:通过集成Quantum-2 InfiniBand和Spectrum-X以太网交换机,提供全面的AI/ML网络解决方案。Nvidia的策略体现了其在市场中的领导地位和对技术多样性的投资。
◉博通:提供全套AI/HPC网络解决方案,包括交换机芯片和网络适配器。博通的战略收购和技术创新,如基于EQDS UDP的传输协议,展现了其在网络优化方面的专业性和前瞻性。
◉思科:推出多功能Silicon One交换机,展示了其网络解决方案的灵活性和创新能力。思科的策略在于提供高效的AI/ML网络解决方案,同时支持多样化的网络应用编程。

这些公司的策略不仅反映了AI/ML网络技术领域的多样性和复杂性,也突显了在追求[敏感词]网络解决方案时的综合考量和战略布局。

AEC有源铜缆是高速互连不可或缺

传统的有源QSFP电缆

QSFP有源高速电缆‌是一种高效的数据传输解决方案,广泛应用于数据中心、高性能计算以及各种需要高速数据传输的场景。这些电缆通常具有高传输速率、稳定性强、低功耗和环保等特性,能够满足不断增长的数据处理需求,同时降低运营成本,提高能源效率。

  • ‌高传输速率与稳定性‌:QSFP有源高速电缆支持高达40Gbps的传输速率,通过四个数据传输通道实现,每个通道支持10Gbps的数据传输。这种电缆的设计能够适应严苛的使用环境,包括温度、湿度以及EMI干扰,从而降低机房维护成本,提高传输的稳定性‌1。

  • ‌低功耗与环保‌:与传统的直连铜缆相比,QSFP有源高速电缆的功耗低,每端功耗小于1.5W,重量更轻,体积更小,光缆的弯折半径也更小,实现更远距离传输。这些电缆采用环保材料,节省空间的同时更加节能环保‌。

  • ‌兼容性与定制性‌:QSFP有源高速电缆适用于市面上各品牌交换机,实现完美兼容。此外,产品长度、颜色、接口类型均可实现定制,满足不同需求‌1。

  • ‌应用场景‌:QSFP有源高速电缆主要用于连接光纤网络装置,提供高速的远距连线能力。它们也用于将50Gb/s服务器连接到TOR交换机,以及在数据中心内实现短距离互连方案‌。

QSFP有源高速电缆通过其高传输速率、低功耗、环保特性以及强大的兼容性和定制性,成为高速互联解决方案中的优选,广泛应用于数据中心、高性能计算等领域,满足不断增长的数据处理需求,同时提高能源效率和降低运营成本‌。


800G HiWire AEC产品系列
Credo Technology Group Holding Ltd(纳斯达克股票代码:CRDO)是一家致力于提供安全、高速连接解决方案的创新型企业,近日宣布推出其专为中国超级数据中心市场量身打造的适用于400G Q112网络接口的HiWire SHIFT AEC (有源电缆Active Electrical Cables)新系列产品,可以满足AI/ML后端网络与TOR交换机之间的网络连接需求。
该新系列SHIFT AEC产品是基于Credo先进的800G HiWire AEC设计优化而来,能效卓越,性能更佳,且具有[敏感词]的可靠性, MTBF(平均故障间隔时间)长达1亿小时,这一点对AI/ML应用而言至关重要。目前,该系列新品正处于样品测试阶段,预计于2025年一季度正式量产。

新系列HiWire SHIFT AEC包括以下产品

  • 400G QSFP-Q112 (4x112) ⇄  2* 200G QSFP-56
  • 400G QSFP-Q112 (4x112) ⇄ 2* 200G QSFP-112
  • 400G QSFP-Q112 (4x112) ⇄ QSFP-Q112 (4x112)


AEC产品负责人Ameet Suri表示:“为了满足中国超级数据中心市场客户对Q112 TOR接口的需求,Credo 拓展其800G HiWire AEC产品系列,推出包含三款Q112新品的HiWire SHIFT AEC新产品系列。HiWire AEC 不断受到超级数据中心运营商们的青睐,被用于NIC与TOR之间的连接。我们期待借助此次推出的AEC新品,进一步提升AEC解决方案在中国市场的渗透率。”
650 Research的负责人Alan Weckel表示:“QSFP112将成为中国超级数据中心市场中AI/ML网络连接关键节点。对于寻求低能耗、高效能、可信赖解决方案的中国新客户而言,无疑会优先考虑在AEC领域占据领先地位的Credo。”


免责声明:本文采摘自“大印蓝海科技”,本文仅代表作者个人观点,不代表澳门新葡萄新京威尼斯987及行业观点,只为转载与分享,支持保护知识产权,转载请注明原出处及作者,如有侵权请联系我们删除。

服务热线

0755-83044319

霍尔元件咨询

肖特基二极管咨询

TVS/ESD咨询

获取产品资料

客服微信

微信服务号