量子通信是利用量子力学原理对量子态进行操控的一种通信形式,可以有效解决信息 安全问题。量子通信是迄今唯一被严格证明无条件安全的通信方式,量子通信所依赖...
2025-01-07 54 云计算行业报告
AI服务器按应用场景可分为训练和推理两种,2021年中国AI服务器推理负载占比约55.5%,未来有望持续提高; 训练对芯片算力要求更高,推理对算力的要求偏低;AI服务器采用异构形式,按芯片类型可分为CPU+GPU、CPU+FPGA、CPU+ASIC等组合; 目前GPU依然是实现数据中心加速的首选,其他非GPU芯片应用逐渐增多,IDC预计到2025年其他非GPU芯片占比超过20%; 一般来说,ASIC的性能最好,但是可编程性和灵活性较弱;在训练或者通用情况下,GPU则是更好的选择。服务器由电源、CPU、内存、硬盘、风扇、光驱等几部分构成,芯片成本(CPU、GPU等)占比较高,在25%-70%不等;
以AI服务器浪潮NF5688M6为例,京东售价约105万人民币,包括2颗Intel Ice Lake处理器(根据cnBeta,约5.3万元/颗) 和8颗NVIDIA A800 GPU(根据ZOL,约10.4万元/颗),CPU和GPU的价值量占比分别为10.10%和79.24%。参数量与算力需求呈正比,据ARK Invest预测,GPT-4参数量最高达15000亿个,则GPT-4算力需求最高可达31271 PFlop/s-day; 与此同时,国内外厂商加速布局大模型,其参数量均达到千亿级别,同步带动算力需求爆发式增长;据IDC预测,2023年AI服务器训练需求占比达41.5%,随着大模型的应用,该比例在2025年将降低至39.2%; 将GPT-4的推算结果作为训练需求,进一步推算2023/2025年推理需求最高达44081/48502 PFlop/s-day。
标签: 云计算行业报告
相关文章
量子通信是利用量子力学原理对量子态进行操控的一种通信形式,可以有效解决信息 安全问题。量子通信是迄今唯一被严格证明无条件安全的通信方式,量子通信所依赖...
2025-01-07 54 云计算行业报告
操作系统是连接硬件和数据库、中间件、应用软件的纽带,是承载各种信息设备和软件应用运行基础平台的重要基础性软件。操作 系统位于底层硬件与应用软件之间,对...
2025-01-01 77 云计算行业报告
协同办公平台的核心功能包括:1)面向全体员工的基础办公模块、2)面向特定业务或职能部门的业务应用模块。通常而言,协同 办公平台厂商会聚焦自身优势能力提...
2024-12-24 58 云计算行业报告
内存墙问题阻碍人工智能发展。根据《AI and Memory Wall》,过去 20 年中服务器硬件 FLOPS 峰 值每 2 年扩大至 3 倍,远超...
2024-12-19 75 云计算行业报告
2024年AIPC有望实现规模出货,预计将加速渗透PC市场。据Omdia,2024年有望成为 AIPC规模出货的元年,此后将迅速增长,至2028年出货...
2024-12-16 78 云计算行业报告
本次调查发现,大型企业(2000人以上企业)在数字化投入方面更为积极, 52%的受访企业预测2024年数字化投入较2023年有所增加。大型企业在数 字...
2024-12-03 83 云计算行业报告
最新留言