模型驱动的科学研究范式是一种现代科学 研究方法,其结合了理论背景与实验数据, 通过建立数学模型或计算模型来模拟和预 测自然界的现象。这一范式首先需要基...
2025-06-18 19 人工智能AI行业报告
通过对算法、框架和硬件进行协同优化,DeepSeek 大模型在性能上表现出 色。DeepSeek 的技术团队擅于在软件层面进行技术优化创新,以此实现大模型的 性能飞跃:1)在 DeepSeek-V3 上,创新性使用无辅助损失的负载均衡策略、FP8 混合精度训练架构、DualPipe 跨节点通信、跨节点全对全通信内核等技术,使模 型获得了能够媲美 GPT-4o 和 Claude-3.5-Sonnet 的性能表现,甚至在数学能力 上性能大幅领先,达到世界领先水平;2)在 DeepSeek-R1 上,探索通过大量纯 强化学习(不通过 SFT 冷启动)和模型蒸馏提升模型推理能力的可能性,最终模 型在性能上比肩 OpenAI o1 正式版。DeepSeek 加速了国产模型的进展,引领了国产大模型的轻量化趋势。自 DeepSeek-R1 模型发布以来短短几个月内,豆包、通义千问、百度、腾讯混元、 阶跃星辰和 Kimi 等其他国产大模型均有重大更新,在模型轻量化方面取得了显著 进展。以豆包和通义千问为例: 豆包:2025 年 1 月 22 日豆包发布 Doubao-1.5-pro,模型使用与 DeepSeek 相同的 MoE 架构,通过训练与推理一体化设计,在保持高性能的同时显著降低 了推理成本。在相同的 9T tokens 训练数据下,激活参数仅为稠密模型 1/7 的 MoE 模型,超过了稠密模型的性能,实现了 7 倍的性能杠杆提升。同时,Doubao-1.5- pro 在视觉和语音多模态方面实现了全面升级。视觉方面,采用原生动态分辨率架 构,支持任意分辨率和长宽比的图像输入,显著提升了模型在视觉推理、文档识别 等任务中的表现;语音方面,提出了端到端的 Speech2Speech 框架,实现了语音 理解与生成的一体化,提升了对话的自然性和情感表达能力。2025 年 3 月 11 日 和4月16日,豆包还分别更新发布了图像生成大模型Seedream 2.0与Seedream 3.0。
标签: 人工智能AI行业报告
相关文章
模型驱动的科学研究范式是一种现代科学 研究方法,其结合了理论背景与实验数据, 通过建立数学模型或计算模型来模拟和预 测自然界的现象。这一范式首先需要基...
2025-06-18 19 人工智能AI行业报告
我们认为 2025年是Agent元年:AI 正从 L2(推理者)向 L3(Agent/智能体)进化,标志着AI 从“思考”走向“行动”。这一转变由四大...
2025-06-18 23 人工智能AI行业报告
AI发展阶段从推理者走向智能体,模型底座智能水平提升。目前,AI发展水平正从推理者向智能体 Agent演进,AI产品逐步能够理解目标、具备外部记忆和推...
2025-06-12 57 人工智能AI行业报告
语言模型是一种人工智能系统,旨在处理、理解和生成类似人类的语言。它们从大型数据集中学习模式和结构,使得能够产生连贯且上下文相关 的文本,应用于翻译、摘...
2025-06-09 58 人工智能AI行业报告
[Download]资源名称:中国NLP大模型行业报告:市场规模测算逻辑模型(11页)...
2025-06-04 29 人工智能AI行业报告
最新留言