首页 行业报告下载文章正文

国产AI行业报告:算力平权(70页)

行业报告下载 2025年06月19日 07:44 管理员

通过对算法、框架和硬件进行协同优化,DeepSeek 大模型在性能上表现出 色。DeepSeek 的技术团队擅于在软件层面进行技术优化创新,以此实现大模型的 性能飞跃:1)在 DeepSeek-V3 上,创新性使用无辅助损失的负载均衡策略、FP8 混合精度训练架构、DualPipe 跨节点通信、跨节点全对全通信内核等技术,使模 型获得了能够媲美 GPT-4o 和 Claude-3.5-Sonnet 的性能表现,甚至在数学能力 上性能大幅领先,达到世界领先水平;2)在 DeepSeek-R1 上,探索通过大量纯 强化学习(不通过 SFT 冷启动)和模型蒸馏提升模型推理能力的可能性,最终模 型在性能上比肩 OpenAI o1 正式版。DeepSeek 加速了国产模型的进展,引领了国产大模型的轻量化趋势。自 DeepSeek-R1 模型发布以来短短几个月内,豆包、通义千问、百度、腾讯混元、 阶跃星辰和 Kimi 等其他国产大模型均有重大更新,在模型轻量化方面取得了显著 进展。以豆包和通义千问为例: 豆包:2025 年 1 月 22 日豆包发布 Doubao-1.5-pro,模型使用与 DeepSeek 相同的 MoE 架构,通过训练与推理一体化设计,在保持高性能的同时显著降低 了推理成本。在相同的 9T tokens 训练数据下,激活参数仅为稠密模型 1/7 的 MoE 模型,超过了稠密模型的性能,实现了 7 倍的性能杠杆提升。同时,Doubao-1.5- pro 在视觉和语音多模态方面实现了全面升级。视觉方面,采用原生动态分辨率架 构,支持任意分辨率和长宽比的图像输入,显著提升了模型在视觉推理、文档识别 等任务中的表现;语音方面,提出了端到端的 Speech2Speech 框架,实现了语音 理解与生成的一体化,提升了对话的自然性和情感表达能力。2025 年 3 月 11 日 和4月16日,豆包还分别更新发布了图像生成大模型Seedream 2.0与Seedream  3.0。

国产AI行业报告:算力平权(70页)

文件下载
资源名称:国产AI行业报告:算力平权(70页)


标签: 人工智能AI行业报告

并购家 关于我们   意见反馈   免责声明 网站地图

分享

复制链接

ipoipocn@163.com

发送邮件
电子邮件为本站唯一联系方式