国产AI行业报告：算力平权（70页）

行业报告下载 2025年06月19日 07:44 管理员

通过对算法、框架和硬件进行协同优化，DeepSeek 大模型在性能上表现出色。DeepSeek 的技术团队擅于在软件层面进行技术优化创新，以此实现大模型的性能飞跃：1）在 DeepSeek-V3 上，创新性使用无辅助损失的负载均衡策略、FP8 混合精度训练架构、DualPipe 跨节点通信、跨节点全对全通信内核等技术，使模型获得了能够媲美 GPT-4o 和 Claude-3.5-Sonnet 的性能表现，甚至在数学能力上性能大幅领先，达到世界领先水平；2）在 DeepSeek-R1 上，探索通过大量纯强化学习（不通过 SFT 冷启动）和模型蒸馏提升模型推理能力的可能性，最终模型在性能上比肩 OpenAI o1 正式版。DeepSeek 加速了国产模型的进展，引领了国产大模型的轻量化趋势。自 DeepSeek-R1 模型发布以来短短几个月内，豆包、通义千问、百度、腾讯混元、阶跃星辰和 Kimi 等其他国产大模型均有重大更新，在模型轻量化方面取得了显著进展。以豆包和通义千问为例：豆包：2025 年 1 月 22 日豆包发布 Doubao-1.5-pro，模型使用与 DeepSeek 相同的 MoE 架构，通过训练与推理一体化设计，在保持高性能的同时显著降低了推理成本。在相同的 9T tokens 训练数据下，激活参数仅为稠密模型 1/7 的 MoE 模型，超过了稠密模型的性能，实现了 7 倍的性能杠杆提升。同时，Doubao-1.5- pro 在视觉和语音多模态方面实现了全面升级。视觉方面，采用原生动态分辨率架构，支持任意分辨率和长宽比的图像输入，显著提升了模型在视觉推理、文档识别等任务中的表现；语音方面，提出了端到端的 Speech2Speech 框架，实现了语音理解与生成的一体化，提升了对话的自然性和情感表达能力。2025 年 3 月 11 日和4月16日，豆包还分别更新发布了图像生成大模型Seedream 2.0与Seedream 3.0。

国产AI行业报告：算力平权（70页）