AI算力芯片机构交流:英伟达针对禁令“改良版”AI芯片与hw昇腾性能对比?服务器厂商将受益?

本文首发于“君实财经”微信公众号,发布时间:2023-11-10

最新纪要研报请微信扫码关注“君实财经”

每天精选消费、医药、互联网、新能源等最新调研纪要和报告,缩小你与一线产业的信息差!

AI算力芯片机构交流231110

事件:

英伟达或推出针对中国市场的最新AI芯片,规格分别为HGXH20、L20PCle、L2PCle,基于英伟达目前最先进的AI芯片H100进行改良,预计英伟达最早将于11月16日正式公布。送样时间预计2023年11-12月,量产时间预计2023年12月-2024年1月。

点评:

【新特供版本单卡算力不及H800/L40S,和A800差距不大,FP16精度差距大】

1)H20vsH800:HGXH20的FP16/32/64算力分别为148/44/1TFLOPS,H800的FP16/32/64算力分别为1979/67/1TFLOPS;

2)H20vsA800:HGXH20的FP16/32/64算力分别为148/44/1TFLOPS,A800的FP16/32/64算力分别为312/19.5/9.7TFLOPS;

3)L20PCIevsL40S:L20PCIe的FP16/32算力分别为119.5/59.8TFLOPS,L40S的FP16/32算力分别为733/91.6TFLOPS。

【单卡算力亦不及华为昇腾910,功耗也是更大,集群差距不大】

1)单卡算力:昇腾910的FP16算力达到320TFLOPS,H20单卡算力为昇腾910约50%;

2)功耗方面,昇腾910芯片310W,L20PCIe、L20PCIe功耗分别为400W、275W;

3)集群:支持8路华为昇腾910AI处理器Atlas800AI训练集群提供算力0.88PFLOPS-2.24PFLOPS@FP16,H20NVlink总线带宽提升至900GB/s并行计算效率和集群性能优化,集群性能二者差距不大。

【带宽有所提升】

1)【H20相较H800拥有更大带宽】H20带宽4TB/s,而H800带宽3.35TB/s。

2)【L20PCIe与L40S带宽相同】L20PCIe带宽864GB/s,与L40S相同。

对产业影响分析如下:

1、国内服务器厂商重新获得英伟达芯片,AI服务器业务接续,浪潮/紫光/中兴等服务器厂商受益;

2、由于性能更差,同等算力需求背景下,需要的数量会更多,服务器厂商将受益,配套的光模块/交换机数量需求也更多,交换机/光模块企业受益;

3、新版本的卡不太适用于AGI大模型训练,适用于行业大模型及应用等,且价格预计并不低,性价比也不高,原来的卡值钱且新卡出租也贵,所以对算力租赁也受益。

通信相关标的

1、服务器/交换机:中兴(有芯片)/紫光/菲菱科思(弹性)/浪潮/盛科等。

2、光模块:旭创/博创/华工/光迅等国内受益,天孚/新易盛等情绪改善;光芯片:源杰/光库/长光/仕佳/永鼎等。

3、算力租赁:润建/润泽/恒润/中贝等。

最新纪要研报请微信扫码关注“君实财经”

每天精选消费、医药、互联网、新能源等最新调研纪要和报告,缩小你与一线产业的信息差!

注意:以上内容来源于网络,友情分享,仅是基于行业以及公司基本面的静态分析,非动态买卖指导。股市有风险,入市需谨慎,请勿跟风买卖!如造成不便,请联系后台删除

Related Posts