Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 31 人工智能AI行业报告
过去半年,国内领军大模型企业实现了大模型 代际追赶的奇迹,从7月份与GPT3.5的20分差 距,每个月都有稳定且巨大的提升,到1 1月份 测评时已经完成总分上对GPT3.5的超越。 我们可以看到GPT3.5和GPT4在中文上的表现 情况基本一致,在11月份测评结果中显示,在中 文能力都有一定的下滑,而国内头部模型则展现 了继续稳健提升的能力。在12月份的测评结果中 可以看到,国内第一梯队模型与GPT4的差距在 缩小。但仍有较大的距离需要追赶。 说明: 趋势展示,选取了7月-12月SuperCLUE-OPEN 测评分数。国内代表性模型,选取了文心一言、 通义千问、ChatGLM。原因是综合考虑了过去 半年SuperCLUE测评结果、长期稳定迭代及对 国内大模型生态的贡献;GPT4成绩,由GPT4- API(7-9月)与GPT4-Turbo(10-12月)组成,用 以表现国外最好模型发展。中 文 语 言 理 解 测 评 基 准 C L U E ( T h e C h i n e s e L a n g u a g e Understanding Evaluation)是致力于科学、客观、中立的语言模型 评测基准,发起于2019年。陆续推出CLUE、FewCLUE、KgCLUE、 DataCLUE等广为引用的测评基准。 SuperCLUE是大模型时代CLUE基准的发展和延续。聚焦于通用大模型的 综合性测评。传统语言模型测评往往局限于学术范围的单轮选择题, SuperCLUE根据多年的测评经验,基于通用大模型在学术、产业与用户 侧的广泛应用,构建了多层次、多维度的综合性测评基准。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 31 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 51 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言