使用Palantir系统时,操作者可以获得全流程的全局掌控。组织级系统整合了ERP、CRM、PLC、MES等多源独立数据,打破了任一 单独企业软件的能...
2026-05-18 29 人工智能AI行业报告
通过对算法、框架和硬件进行协同优化,DeepSeek 大模型在性能上表现出 色。DeepSeek 的技术团队擅于在软件层面进行技术优化创新,以此实现大模型的 性能飞跃:1)在 DeepSeek-V3 上,创新性使用无辅助损失的负载均衡策略、FP8 混合精度训练架构、DualPipe 跨节点通信、跨节点全对全通信内核等技术,使模 型获得了能够媲美 GPT-4o 和 Claude-3.5-Sonnet 的性能表现,甚至在数学能力 上性能大幅领先,达到世界领先水平;2)在 DeepSeek-R1 上,探索通过大量纯 强化学习(不通过 SFT 冷启动)和模型蒸馏提升模型推理能力的可能性,最终模 型在性能上比肩 OpenAI o1 正式版。DeepSeek 加速了国产模型的进展,引领了国产大模型的轻量化趋势。自 DeepSeek-R1 模型发布以来短短几个月内,豆包、通义千问、百度、腾讯混元、 阶跃星辰和 Kimi 等其他国产大模型均有重大更新,在模型轻量化方面取得了显著 进展。以豆包和通义千问为例: 豆包:2025 年 1 月 22 日豆包发布 Doubao-1.5-pro,模型使用与 DeepSeek 相同的 MoE 架构,通过训练与推理一体化设计,在保持高性能的同时显著降低 了推理成本。在相同的 9T tokens 训练数据下,激活参数仅为稠密模型 1/7 的 MoE 模型,超过了稠密模型的性能,实现了 7 倍的性能杠杆提升。同时,Doubao-1.5- pro 在视觉和语音多模态方面实现了全面升级。视觉方面,采用原生动态分辨率架 构,支持任意分辨率和长宽比的图像输入,显著提升了模型在视觉推理、文档识别 等任务中的表现;语音方面,提出了端到端的 Speech2Speech 框架,实现了语音 理解与生成的一体化,提升了对话的自然性和情感表达能力。2025 年 3 月 11 日 和4月16日,豆包还分别更新发布了图像生成大模型Seedream 2.0与Seedream 3.0。

标签: 人工智能AI行业报告
相关文章
使用Palantir系统时,操作者可以获得全流程的全局掌控。组织级系统整合了ERP、CRM、PLC、MES等多源独立数据,打破了任一 单独企业软件的能...
2026-05-18 29 人工智能AI行业报告
目前中国市场仍处于初期发展阶段,但表现出显著的增长潜力。截至2023年,中国AI4S市场规模已达到47亿元人民 币,涵盖药物研发、合成生物学、基因测序...
2026-05-18 26 人工智能AI行业报告
需求+政策推动,Token数量指数级增长,产业链协同发展大受益:从海外的ChatGPT、Sora到国内的文心一言、Kimi,AI应用正从文本生成向多模...
2026-05-18 38 人工智能AI行业报告
[Download]资源名称:摩根斯坦利报告:人工智能的力量:灵活算力——AI增长的下一个浪潮(英文,60页)...
2026-05-11 37 人工智能AI行业报告
[Download]资源名称:AI原生组织研究报告:OpenClaw推动组织形态重塑(47页)...
2026-05-08 48 人工智能AI行业报告
最新留言