中国·澳门新葡萄新京威尼斯(987-官方网站)-Ultra Platform

/ EN
13922884048

专家专栏

Expert column
/
/

参考RISC-V架构,25 颗芯片合一,特斯拉晶圆级 Dojo 处理器已量产

发布时间:2024-05-07作者来源:澳门新葡萄新京威尼斯987浏览:954

IT之家 5 月 4 日消息,上周召开的台积电(TSMC)北美技术研讨会上,特斯拉表示专门用于训练 AI 的晶圆级 Dojo 处理器已经投入量产,距离部署已经不远了。

图片

特斯拉的 Dojo 晶圆上系统(system-on-wafer)处理器(特斯拉官方称其为 Dojo Training Tile)采用 5*5 阵列共计 25 颗芯片,这些芯片放置在载体晶圆上,然后使用台积电的集成扇出(InFO)技术进行晶圆级互连(InFO_SoW)互连。

据 IEEE Spectrum 报道,InFO_SoW 技术旨在实现高性能连接,让特斯拉 Dojo 的 25 个芯片可以像 1 个处理器一样工作;同时为了让晶圆级处理器保持一致,台积电用虚拟芯片填充了芯片之间的空白点。

图片

特斯拉晶圆级 Dojo 处理器实际上包含了 25 个超高性能处理器,耗电量非常高,因此需要复杂的冷却系统。

特斯拉为了满足 Dojo 处理器的供电需求,使用复杂的电压调节模块,为计算平面提供 18000 安培的电力,散发的热量高达 15000W,因此需要水冷散热。

特斯拉尚未透露其 Dojo 晶圆系统的性能 —— 不过,考虑到其开发过程中面临的所有挑战,它似乎有望成为人工智能训练的一个非常强大的解决方案。IT之家附上相关图片如下:

图片

晶圆级处理器,例如 Tesla 的 Dojo 和 Cerebras 的晶圆级引擎 (WSE),比多处理器机器的性能效率要高得多。它们的主要优点包括内核之间的高带宽和低延迟通信、降低的电力传输网络阻抗以及卓越的能源效率。此外,这些处理器可以受益于拥有冗余的“额外”核心 —— 或者,对于特斯拉来说,拥有已知良好的处理器核心。

特斯拉的Dojo处理器是专门为人工智能训练设计的晶圆级处理器,具有以下显著特点:

1. 高集成度:Dojo处理器采用5x5阵列,共计25颗芯片,这些芯片放置在载体晶圆上,并使用台积电的集成扇出(InFO)技术进行晶圆级互连(InFO_SoW)。

2. 高性能连接:InFO_SoW技术旨在实现高性能连接,让25个芯片可以像1个处理器一样协同工作。

3. 高耗电与冷却需求:由于Dojo处理器耗电量非常高,因此需要复杂的冷却系统,特斯拉为此设计了专门的电压调节模块和水冷散热系统。

4. 专用于AI计算:Dojo核心具有类似CPU的风格,比GPU更能适应不同的算法和分支代码,并且具有专注于加速AI计算的自定义向量指令。

5. 存算一体架构:D1芯片采用存算一体架构,运行在2GHz,拥有巨大的440MB SRAM,提供近存计算的优势。

6. RISC-V架构参:D1处理器的指令集参考了RISC-V架构,并自定义了一些指令,特别是矢量计算相关的指令。

7. 高算力密度:Dojo核心提供了1.024TFLOPS的算力,且几乎所有的算力都由矩阵计算单元提供。

8. 数据流近存计算架构:D1处理器拥有分布式SRAM,通过大量更快更近的片上存储减少对内存的访问频度,提升系统性能。

9. 高带宽和低延迟:Dojo处理器的NoC网络可以处理跨节点边界的数据同步,提供高带宽和低延迟的通信。

10. 定制化架构:Dojo是一套完全可定制的架构,全面涵盖计算、网络、输入/输出(I/O)芯片。

11. 潜力巨大:据分析,Dojo有潜力为特斯拉增加巨额市值,特别是在移动和网络服务方面的应用。

12. 先进封装技术:Dojo训练模块采用先进的InFO_SoW封装技术,提高芯片间的互连密度。

13. 高性能计算:Dojo处理器由台积电制造,采用7纳米工艺,拥有500亿个晶体管,芯片面积为645mm²,小于业界同类产品。

这些特点使得特斯拉的Dojo处理器在人工智能训练领域具有潜在的高性能和高效率,有望成为AI计算的强大解决方案。

免责声明:本文原创作者张国斌,本文仅代表作者个人观点,不代表澳门新葡萄新京威尼斯987及行业观点,只为转载与分享,支持保护知识产权,转载请注明原出处及作者,如有侵权请联系我们删除。

服务热线

0755-83044319

霍尔元件咨询

肖特基二极管咨询

TVS/ESD咨询

获取产品资料

客服微信

微信服务号