首页 行业报告下载文章正文

AIGC行业报告(36页)

行业报告下载 2023年03月06日 08:18 管理员

多模态技术(Multimodal Technology)即将图像、语音、视频、文字等多模态融合的机器 学习技术,而 CLIP(Contrastive Language–Image Pre-training)的推出成为跨模态应用 生成的重要节点。CLIP 在 2021 年由 OpenAI 开源推出,能够将文字和图像进行关联且关 联特征丰富,后续“CLIP+其他模型”成为跨模态生成领域的较通用的做法,如 Disco  Diffusion 便是将 CLIP 与 Diffusion 模型进行关联,用户输入文字指令便能够生成相关的图 片。在多模态技术的加持下,预训练模型已经从早期单一的 NLP、CV 向多模态、跨模态 的方向发展。从产业链结构来看,AIGC 主要包括基础层、中间层和应用层,中外差距在 3 年左右。由 于技术与投资环境差异,AIGC 在我国大多作为公司的部分业务进行开发,独立的初创公 司数量较少,导致 AIGC 实际的场景开发较国外仍有差距。据量子位,中外公司的整体差 距在 3 年左右,底层技术是核心原因。 #1 基础层 基础层即预训练模型,构成了 AIGC 的基础。随着预训练模型参数的增加,预训练所需要 的数据量同样快速提升,带来较高的成本投入。据中国信通院与京东探索研究院发布的 《人工智能生成内容白皮书 2022》,模型参数量已从最初的千万级发展到了千亿级别,训 练代价也从数十天增长到几十万天(按在单张 V100 GPU 计算)。

据北京智源人工智能研 究院,2020 年 OpenAI 发布的 NLP 模型 GPT-3 的参数量约 1,750 亿,训练数据量达 45TB,模型训练成本近 1,200 万美元。因此该领域的参与者主要是科技巨头与头部的研究 机构,如 OpenAI、谷歌、微软、Meta、百度等。 #2 中间层 中间层即垂直化、场景化、个性化的模型。在预训练模型的基础上,能够快速生成垂直化 的小模型,实现流水线式的开发,降低开发成本,提升效率。如 Stable Diffusion 开源后 多个绘画模型基于 Stable Diffusion 开发,二次元绘画领域包括知名的 NovelAI,而昆仑万 维的天工巧绘 SkyPaint 模型则采用全球第一款多语言 Stable Diffusion 分支模型,兼容 Stable Diffusion。据腾讯研究院,随着大模型+多模态加速成长为通用性技术平台,模型 即服务(Model-as-a-Service,MaaS)逐渐实现,通过 API 授权有望助力 AIGC 变现。 #3 应用层 应用层即面向 C 端的 AIGC 应用。从模态上看,应用层包括图像、音频、文本、视频等, 其中图像领域代表产品包括 MidJourney、Dream Studio 等;音频包括 DeepMusic 等;文 本包括 ChatGPT、Sudowrite 等;视频包括 Runway 等。从形式上看,应用层包括 App、 网页、小程序、聊天机器人等,将 C 端用户与模型联通,已经逐渐渗透到生活中的各个领 域,如 MidJourney 搭载在聊天软件 Discord 中推出,ChatGPT 则支持网页直接登录,国 内的如昆仑万维的天工巧绘 SkyPaint 能够通过微信小程序登录,满足用户的多样化需求。

AIGC行业报告(36页)

文件下载
资源名称:AIGC行业报告(36页)


标签: 人工智能AI行业报告

并购家 关于我们   意见反馈   免责声明 网站地图 京ICP备12009579号-9

分享

复制链接

ipoipocn@163.com

发送邮件
电子邮件为本站唯一联系方式