边缘域AI行业报告（98页）

行业报告下载 2023年09月08日 06:32 管理员

从 Open AI 产品矩阵可以看出其已经布局文本、图片、语音等多模态产品，未来将逐步探索多模态的融合，实现图像、视频、文本间跨模态生成，显著提升智能终端产品体验，带来各行各业生产力水平的质变。国际科技巨头加紧布局多模态模型领域。微软和谷歌两大巨头相继推出大模型，2023 年 3 月，OpenAI 推出 GPT-4 模型，可以接受图像和文本输入，并输出文本。3 月谷歌推出 PaLM-E 模型，通过输入多模态语句，包括视觉、连续状态估计和文本输入编码，来执行机器人操作规划、视觉问题解答等具体操作；5 月谷歌推出 PaLM2 模型，支持 100 多种人类语言与 20 多种编程语言，同时支持读取与生成音视频内容。AI 领域群体效应下，国内大厂纷纷入局。国内 AI 大厂以百度文心一言发布为拐点，未来有望凭借更优质的中文数据和多场景的应用实现弯道超车。百度文心一言是国内首个全栈大模型产品，模型发布后申请合作厂商超 9 万家，腾讯、阿里、华为、商汤等大厂在 AI 大模型领域已有成熟布局，相关应用有望快速发布。伴随着多模态大模型的不断涌现，更多场景的 AI 应用将加速落地。除大模型外，龙头厂商也纷纷布局轻量级模型，当前 Meta、谷歌、高通等公司已开始发力边缘 AI。

谷歌和 Meta 分别于今年 5 月 11 日和 7 月 19 日发布了各自最新的大语言模型版本 PaLM 2 和 Llama 2，较以往版本实现测试数据、性能等全面优化，轻量化版本均能应用于边缘端，其中最新发布的 Meta 大模型 Llama 2 更是开放开源免费使用，有望推动边缘 AI 迎来“安卓时刻”。此前，芯片龙头厂商高通也首次成功实现 Stable Diffusion 模型在手机端应用生成 AI 图像，并于 5 月 30 日宣布高通正在转型为边缘计算公司，全面下注边缘 AI。Llama2 模型的训练数据量、参数均有增加。Llama 2 的参数、训练数据和上下文长度相比上一代模型增加。新模型 Llama 2 系列包含 70 亿、130 亿和 700 亿三种参数类型，相比原来 Llama 1 最多 650 亿参数有所增加。并且，相比于 Llama 1 预训练模型 1.4 万亿的训练 token 数，Llama 2 预训练模型的训练数据提升了 40%至 2 万亿，且针对聊天用例进行的 Chat 模型精调训练数据超过 100 万人类标记数据，使用人类反馈进行强化学习（RLHF）从而提高模型安全性。此外，对于大模型非常重要的上下文长度限制，Llama 2 比 Llama 1 翻了一倍至 4096 字符，能处理更多信息。Llama 2 模型在大多数基准测试中表现优于其他开源模型，包括编码、推理、知识、精通性测试等。不仅如此，Meta 从有用性和安全性进行评估，认为 Llama 2 有希望成为闭源模型的替代品。

边缘域AI行业报告（98页）