海内外头部算力租赁厂商 ROI 逐步兑现。1)头部算租厂商营收与订单双爆发:海内外算力租赁厂商 ROI 逐步兑 现,甲骨文 FY26Q3 的 OCI...
2026-05-07 29 云计算行业报告
集群的有效算力可以分解为 GPU 利用率、集群的线性加速比,GPU 的利用率受制 于芯片架构的制程、内存和 I/O 访问瓶颈、卡间互联带宽和拓扑、芯片功耗等因素, “集群线性加速比”则取决于节点的通信能力、并行训练框架、资源调度等因素。因 而,如何设计高效的集群组网方案,满足低时延、大带宽、无阻塞的机间通信,从而 降低多机多卡间数据同步的通信耗时,提升 GPU 有效计算时间比(GPU 计算时间/ 整体训练时间)至关重要。基于中国移动研究院的《面向 AI 大模型的智算中心网络 演进白皮书》,AI 大模型对网络建设也提出了新的要求:超大规模组网:训练参数达到千亿-万亿级别的 AI 超大模型代表着超高速算力需 求,并进一步对应着大量的硬件需求及与之匹配的网络可延展能力。根据《面向 超万卡集群的新型智算技术白皮书》,当单集群中卡的数量达到万卡级别后,相 应的,如何实现最优运算效率、最佳数据处理能力、硬件层面的万卡互联、网络 系统的可用和易运维等,会成为 AI 智算中心的新议题。RDMA((Remote Direct Memory Access 远程直接内存访问)可以降低多机多卡间 端到端通信时延。在传统网络中,数据传输涉及多个步骤:首先将数据从源系统的内 核复制到网络堆栈,然后通过网络发送。最后,在接收端执行多个步骤后,将数据复 制到目标系统的内核中。RDMA 可以绕过操作系统内核,让一台主机可以直接访问 另外一台主机的内存。目前 RDMA 技术的主要采用方案有 Infiniband 和 RoCEv2(基 于 RDMA 的 Ethernet 技术,后简称为 RoCE)两种。

标签: 云计算行业报告
相关文章
海内外头部算力租赁厂商 ROI 逐步兑现。1)头部算租厂商营收与订单双爆发:海内外算力租赁厂商 ROI 逐步兑 现,甲骨文 FY26Q3 的 OCI...
2026-05-07 29 云计算行业报告
模型跃迁叠加 Agent 出圈引爆推理需求,云厂涨价印证算力斜率依旧。今年以来,我们持 续强调国内算力需求斜率陡峭,核心逻辑在于两大产业趋势共振:1)...
2026-05-02 49 云计算行业报告
2025-2030年,中国数据中心市场新增IT负载预计从5.9GW增至15.1GW,CAGR约+21%,市场规模从2231亿增至6454亿,CAGR约...
2026-04-28 37 云计算行业报告
本报告的核心研究对象是量子计算产业。量子计算机是一种基于量子力学原理构建的计算设备, 是以量子比特(qubit)为基本单元,利用干涉、叠加、纠缠等量子...
2026-04-17 64 云计算行业报告
量子亮相春晚,“量子的未来就在我们手中”。2026 年央视春晚合肥分会场,潘建伟院士手捧“墨子号”模型,掷 地有声地说:“量子的未来就在我们手中”,在...
2026-04-12 49 云计算行业报告
生成式 AI 加速落地、算力需求持续抬升的背景下,全球云厂商资本开支进 入新一轮扩张周期。全球云厂商(CSP)AI 资本开支激进扩张,对承载高功 耗设...
2026-04-06 48 云计算行业报告
最新留言