全球超算中心与量子计算机的融合正在加速推进。各种类型和规模的超算中心,无论是大型的 国家级研究机构还是小型的企业级实验室,都在积极探索与量子计算机的集...
2024-03-04 48 云计算行业报告
AI服务器按应用场景可分为训练和推理两种,2021年中国AI服务器推理负载占比约55.5%,未来有望持续提高; 训练对芯片算力要求更高,推理对算力的要求偏低;AI服务器采用异构形式,按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合; 目前GPU依然是实现数据中心加速的首选,其他非GPU芯片应用逐渐增多,IDC预计到2025年其他非GPU芯片占比超过20%; 一般来说,ASIC的性能最好,但是可编程性和灵活性较弱;在训练或者通用情况下,GPU则是更好的选择。服务器由电源、CPU、内存、硬盘、风扇、光驱等几部分构成,芯片成本(CPU、GPU等)占比较高,在25%-70%不等;
以AI服务器浪潮NF5688M6为例,京东售价约105万人民币,包括2颗Intel Ice Lake处理器(根据cnBeta,约5.3万元/颗) 和8颗NVIDIA A800 GPU(根据ZOL,约10.4万元/颗),CPU和GPU的价值量占比分别为10.10%和79.24%。参数量与算力需求呈正比,据ARK Invest预测,GPT-4参数量最高达15000亿个,则GPT-4算力需求最高可达31271 PFlop/s-day; 与此同时,国内外厂商加速布局大模型,其参数量均达到千亿级别,同步带动算力需求爆发式增长;据IDC预测,2023年AI服务器训练需求占比达41.5%,随着大模型的应用,该比例在2025年将降低至39.2%; 将GPT-4的推算结果作为训练需求,进一步推算2023/2025年推理需求最高达44081/48502 PFlop/s-day。
标签: 云计算行业报告
相关文章
全球超算中心与量子计算机的融合正在加速推进。各种类型和规模的超算中心,无论是大型的 国家级研究机构还是小型的企业级实验室,都在积极探索与量子计算机的集...
2024-03-04 48 云计算行业报告
算力+双碳提升散热要求,液冷优势明显,有望规模化推广 大模型推动算力需求高增,且受“双碳”宏观背景影响,对散热要 求提升。针对单芯片,液冷相比于风冷散...
2024-02-29 60 云计算行业报告
企业数据运营能力是数据管理的下一阶段,我国企业数据管理能力发 展稳中有进,为进一步开展数据运营奠定了工作基础。自2019年起,各行 业主管机构陆续发布...
2024-02-12 72 云计算行业报告
算力是数字经济运行和发展的基石和前提。IDC发布的《2021-2022全球计算力指数报告》指出,算力对经济增长的拉动具有长期性和倍增效应: 计算力指数...
2024-02-02 144 云计算行业报告
最新留言