[Download]资源名称:DeepSeek专题报告:通信算力降本增效(30页)...
2025-03-31 25 人工智能AI行业报告
我们认为算力是制约中国发展以 ChatGPT 为代表的大模型主要瓶颈之一。 据 OpenAI,大模型训练所需算力每 3-4 个月增长 1 倍,增速远超摩尔定律 (18-24 个月/倍)。随着 GPT-4 等下一代大模型出现,算力需求还有望进一 步大幅增长。我们认为美国对华出口限制,主要造成中国先进工艺发展短期 受限、国产替代方案或推高大模型训练成本/时间两大影响。中国发展高性 能计算,应加大在:1)异构计算芯片架构;2)先进封装方面的投入。我们 看到在长电、通富、盛合晶微、华峰、中芯国际等在先进封装领域,寒武纪、 海光、芯原、燧原、沐曦等在异构计算(算力芯片、IP)等领域积极布局。 影响#1:先进工艺对提升芯片性能至关重要,中国大陆发展短期受限 发展先进制程意义在于持续提升晶体管密度,提升芯片性能、降低功耗。根 据 WikiChip,台积电 5nm 芯片每平方毫米晶体管数量是 10nm 3.3 倍,16nm 5.9 倍,3nm 晶体管密度有望比 5nm 提升 70%,性能提升 11%,功耗降低 27%。美国限制 16/14nm 及以下先进逻辑工艺技术及设备向中国出口,对 中国先进制程短期发展造成较大阻力。进入 3nm 制程以下,目前主流 FinFET 将走向物理极限,GAAFET 将成为主流技术,但美国对中国禁售相关 EDA 软件。
同时,荷兰 EUV 及先进 DUV 光刻设备目前均无法对中国出口。 影响#2:A100 进口限制阻碍大模型发展,国内替代方案或推高成本 22 年 8 月美国限制英伟达、AMD 对华出口高端 GPU 芯片,尽管后来有替 代版本 A800 推出,但由于对高速互联总线的带宽做部分裁剪,在使用性能 和功耗上面仍与 A100 有部分差距。目前 H100 性能是 A100 的 4.5 倍,而 A800 理论性能相比 A100 降低约 1/3,随着算力需求不断增加,国内由于 A100 以上芯片的进口限制导致大模型训练时间/成本或显著提升,客观上阻 碍了我国大模型的发展。因中国企业进行 14nm 以下半导体代工受到技术及 设备限制,及美国限制海外代工企业为中国设计企业生产性能超过 A100 的 芯片,短期内,中国芯片公司能够生产超过 A100 的 AI 芯片的难度也较高。 路径#1:异构计算蓬勃发展,关注 GPU,DPU,存算一体等不同路径 面对先进制程昂贵成本和日趋接近物理极限,仅靠工艺改进难以满足算力膨 胀需求。异构计算从计算架构出发,充分利用计算资源并行分布,将不同制 程/架构、不同指令集、不同功能硬件进行组合,成为解决算力瓶颈更为经 济的方式。目前主流异构包括 1)GPU(英伟达/AMD),2)DPU(英伟达 子公司 Mallonex),3)存算一体,4)自适应加速器(AMD)等路径。目前 中国拥有海光、龙芯、鲲鹏等 CPU 公司,寒武纪、天数、燧原、芯动、登 临等 GPU 公司及云豹智能、中科驭数等 DPU 公司,异构计算正蓬勃发展。
标签: 人工智能AI行业报告
相关文章
根据ARK Invest报告显示,“AI+情感陪伴”的市场规模将扩大2300-5000倍,从现在的全球年收入 3000 万美元增至 700 亿至 15...
2025-03-30 28 人工智能AI行业报告
[Download]资源名称:Deepseek报告:AI狂潮下计算机行业的颠覆与重生(28页)...
2025-03-29 30 人工智能AI行业报告
结构性矛盾如同深埋于医疗体系肌体内的病灶,长期困扰着全球医疗健康产 业的发展。然而,危机往往也孕育着变革的契机。正是这些难以克服的结构性矛盾, 催生了...
2025-03-27 43 人工智能AI行业报告
大模型商业生态推动端侧场景落地。过去 ChatGPT 引领了全球 AI 产业,国 内外公司纷纷布局 AI 赛道。国内多家厂商探索商业化路径,在激烈竞争...
2025-03-25 44 人工智能AI行业报告
根据DeepSeek团队在论文中强调,通过优化算法、框架和硬件的协同设计实现的。在预训练阶段,每万亿个token上训练 DeepSeek-V3只需要1...
2025-03-24 80 人工智能AI行业报告
最新留言