感谢IT之家网友 航空先生 的陈迹送达!
IT之家 4 月 9 日音尘,在今晚的 Vision 2024 活动中,英特尔发布了新一代 Gaudi 3 AI 芯片,并将于 2024 年第三季度通过 OEM 系统多半量上市。
据先容,新款 Gaudi 3 与英伟达 H100 比拟考试性能提高了 170%,推理才能提高了 50%,成果提高了 40%,但老本却低得多(IT之家注:H100 依然是英伟达上一代家具,英特尔并未与最新的 Blackwell 系列家具进行对比)。
此外,英特尔还为其数据中心 CPU 家具组合推出了全新品牌定名:原代号为 Granite Rapids 和 Sierra Forest 的芯片现时将被称为 “Xeon 6” 系列。这些芯片谋略于本年上市,并将辅助全新性能擢升的标准化 MXFP4 数据范例。
英特尔同期文告正在树立用于以太网收集的 AI NIC ASIC 以及 AI NIC 小芯片。这些小芯片将用于其改日 XPU 和 Guadi 3 处理器,并将通过英特尔代工场提供给外部客户,不外英特尔并未显现更多对于这些收集家具的细节。
英特尔全新 Gaudi 3 AI 加快器接管 5nm 工艺打造,FP8 性能是上一代家具的两倍,BF16 性能是上一代家具的四倍,收集带宽是上一代家具的 2 倍,内存带宽是上一代家具的 1.5 倍,并提供 Mezz 卡、板载和 PCIe 三种款式。
Gaudi 3 提供 64 个第五代张量处理中枢和 8 个矩阵筹办引擎,并搭载 128GB 速率达 3.7TB / s 的 HBM 内存和 96MB 速率达 12.8TB / s 的 SRAM。聚积方面辅助 24 条的 200GbE 稳妥 RoCE 标准的以太网总线以及最高 16 条 PCIe 5.0 总线。
板载版块 Gaudi 3 型号为 HLB-325,由八颗 Gaudi 3 Mezz 卡构成,提供 14.6PFLOPS FP8 性能,1TB 带宽速率达 29.6TB / s 的 HBM2e 内存,64 个线性筹办引擎,192 条 200GbE 收集总线,9.6TB / s 婉曲才能。
PCIe 版块型号为 HL-338,提供单卡 1835TFLOPS FP8 峰值性能,128GB HBM2e 内存,8 个线性筹办引擎,24 条 200GbE 收集总线,600W TDP,整张卡占据两卡槽高度。
Gaudi 3 单个节点(8 个 Gaudi 3 AI 加快器)不错提供 14.7PF FP8 筹办性能,128GB 内存及 8.4TB / s 收集读写速率;64 节点集群(512 个 Gaudi 3 AI 加快器)提供 940 PF FP8 筹办性能,65.5TB 内存及 76.8TB / s 的收集读写才能;512 节点集群(4096 个 Gaudi 3 AI 加快器)提供 7.52EF FP8 筹办性能,525.3TB 内存及 614TB / s 收集读写速率;1024 节点集群(8192 个 Gaudi 3 加快器)则提供 15EF FP8 筹办性能,1PB 内存及 1.229PB/s收集读写才能。
具体来看,英特尔 Gaudi 3 与主要的竞品英伟达 H100 在疏浚节点数目下,推敲大模子考试本事对比上至高有 1.7 倍上风,其中,LLAMA2 70 亿参数对比有 1.5 倍于 H100 的上风,LLAMA2 130 亿参数最高有 1.7 倍的上风,GPT 3 1750 亿参数有 1.4 倍上风。推理速率和能效发扬上,Gaudi 3 比拟于 H100 也有较大幅度擢升。
软件生态方面,英特尔 Gaudi 3 针对生成式 AI 提供端到端全栈 AI 软件处置决策,包括镶嵌式软件、软件套件、AI 软件、AI 掌握。
通过 Gaudi 3 不错辅助基于还辅助多模态、大道话模子、增强检索生成中枢才能的 3D 生成、文本生成、视频图片生成、本体回来、翻译、问答、分级等常见 AI 功能。依靠丰富的 AI 软件生态,Gaudi 3 也辅助常见的 AI 框架库、使用场景和器用,并对有代表性的模子进行辅助。英特尔还提供 Gaudi 软件套件,提供对底层硬件的辅助。
英特尔在 Vision 2024 上也公布了 Gaudi 3 坐褥节点,2024 年一季度将最初推出风冷版样品,二季度推出液冷版样品,并在本年第三、第四季度分歧批量委用风冷版和液冷版。Gaudi 3 将由戴尔、惠与、联念念和超微四家 OEM 提供。
在此基础上,英特尔也文告 Gaudi 3 本年下半年可在英特尔 Developer Cloud 赢得。除了英特尔 Gaudi 3 加快器除外,英特尔还提供了对于其在企业 AI 各个界限的下一代家具和处事的更新。
全新英特尔 Xeon 6 处理器行为英特尔全新品牌初次亮相,它主要针对生成式 AI 筹办,Xeon 6 处理器包含高效中枢 E-core 和性能中枢 P-core。Xeon 6 E-core 代号 Sierra Forest,比拟第二代英特尔 Xeon 处理器,性能每瓦提高 2.4 倍,况且机架密度提高 2.7 倍。对于英特尔的客户而言,不错以接近 3 比 1 的比例替换老旧系统,大幅降险诈耗,鼓励完结可捏续发展主义。Xeon 6 P-core,代号 Granite Rapids,辅助 MXFP4。
PC、边际端和聚积方面,英特尔酷睿 Ultra 处理器 AI PC 家具行为坐褥力、安全性和本体创作的器用,预测本年将发货 4000 万台 AI PC。除此除外,英特尔文告了一系列新的边际芯片,涵盖了英特尔酷睿 Ultra、英特尔酷睿、英特尔凌动处理器和英特尔 Arc GPU,主义市集包括零卖、工业制造和医疗保健。这些新品将在本季度推出。
另外,英特尔谋略与 Ultra Ethernet Consortium 调解推出 AI 以太网处置决策,处置普遍数据量下 AI 大模子收集问题。这一家具谋略将在 2026 年推出。
告白声明:文内含有的对外跳转不息(包括不限于超不息、二维码、口令等体式),用于传递更多信息,省俭甄选本事,猖狂仅供参考,IT之家通盘著述均包含本声明。
声明:新浪网独家稿件,未经授权扼制转载。 -->