大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
我们从以上三个维度,分析当前发布的部分大模型: 1)算力:算力布局主要来源于芯片的采购布局,算力基础设施的投入阻挡了部分小公 司的入局。当前数据训练需要较高性能的芯片完成对整体模型神经网络的训练构建, 供应厂商包括英伟达等。应用层面只需调用整体大模型里的部分神经网络,故对芯片 要求没有训练模型时那么高。 2)算法:OpenAI 仍有先发优势,GPT-3 之后并未开源。每家公司都有自己实现大模型 的路径算法,由于 GPT 在成立之初就坚持自己的算法路径(采用单项 Transformer 架 构等),并在此基础上运用大量数据训练使得模型产生的涌现能力,取得了一定的成功, 拥有先发优势。自 GPT-3 开始(2020 年),OpenAI 便不再公布大模型相关训练及技 术细节。虽然当前 OpenAI 的成功提供部分借鉴,但其他公司仍需时间去研发追赶并进 行模型迭代。 除此以外,部分公司在特定领域拥有算法积累的先发优势,比如搜索类公司对语料的 切割和识别有先发优势,视觉类公司在图像领域识别有先发优势。 3)数据:当前中文语料规模与质量上不如英文语料。根据 W3Techs,中文网站占全球 网站数 1.3%,英文网站占比 63.6%。除此以外,由于中国移动互联网发展较为成熟, 大量的中文数据资源被存于各家企业或机构里,较难共享。
目前,国内已有百度、阿里巴巴、腾讯、华为等公司对 AI 大模型进行开发,各模型系 列主要的 NLP 语言大模型、CV 大模型、多模态大模型也已推出并实现部分应用落地。 此外,据 36 氪消息,字节跳动也在语言和图像大模型上有所布局,预期将于今年年中 推出字节自研大模型。具体来看: 百度在 AI 方面布局多年,具有一定大模型先发优势。当前,申请文心一言 API 调用服务测试的企业已突破 6.5 万。在行业大模型上,已经与国网、浦发、吉利、 TCL、人民网、上海辞书出版社等均有案例应用。 阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生 态和产品线,在出行场景、办公场景、购物场景和生活场景均有广泛应用。 腾讯混元大模型已经在广告投放、游戏制作投入使用,目前集团在研究对话式智 能助手,预计投入使用后将对 QQ 和微信生态有一定优化。 华为与 B 端合作紧密,预计未来应用以 ToB 为主。此外,华为在算法、算力上储 备较为丰厚。比如“鹏城云脑 II”获全球 IO500 排行五连冠,拥有强大的 AI 算 力和数据吞吐能力。华为云 ModelArts 平台的高效处理海量数据能力,7 天完成 了 40TB 文本数据处理。盘古大模型最早已经在 2021 年 4 月正式发布,当前盘古 大模型训练文本数据高达 40 TB(GPT-3 为 45 TB)。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 75 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 103 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 86 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 95 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 65 人工智能AI行业报告
最新留言