大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
AI 赋能虚拟人行业,市场空间广阔。根据艾媒咨询数据,2022 年我国虚拟人核 心市场规模达到 120.8 亿元,同比增长 94.2%。2023 年 AI 大模型相继发布,有 望赋能虚拟人产业,实现多环节降本增效,大幅提升应用端交互能力,到 2025 年虚拟人行业核心市场规模有望达到 480.6 亿元。根据 IDC 咨询,根据虚拟人的自动化水平,可分为 L1-L5 阶段。L1 阶段虚拟人 依赖人工制作形象和动画,L2 阶段虚拟人依赖外部动捕设备采集肢体、表情和 口型信息,L3 阶段虚拟人依赖算法驱动肢体、姿态等拟人化特征。AI 推动虚拟 人智能化水平提升,实现虚拟数字人向 L4、L5 层级迈进,业务价值、自动化水 平大幅提升。根据商汤智能研究院,AI 数字虚拟人三大特征包括:多模态交互、深度学习能 力、AIGC 生产力。
相较早期数字人制作对人工依赖较高,AIGC 大幅提升了 AI 数字人制作效率,制作门槛降低;大模型多模态生成能力提升了虚拟人交互能力, 真人替代能力提升;相较于早期数字人,深度学习等算法使得 AI 数字人具备更 高创造力。虚拟人的构建流程主要包括建模、驱动和渲染等环节。建模作为基础环节,是决 定虚拟人整体形象的关键,驱动实现虚拟人由静到动,渲染技术提升画面质感, 增强虚拟人的真实感。 驱动环节分为面部和身体动作的驱动。面部以嘴型为主,主要通过算法训练建立 文本到语音再到嘴型视频的对应关系,得到文本驱动嘴型变化的模型。虚拟人的 身体动作主要通过动作捕捉技术获得真人演员的行为动作,再将其移植到虚拟人 上。动捕技术包括光学、惯性和基于计算机视觉三种,光学动捕精度较高,应用 也较为成熟,设备造价较高;惯性动作捕捉成本较低,场地的限制较小,但精度 较差。计算机视觉动捕较为简便,利用摄像头拍摄的图像进行三维建模,成本也 相对较低,而建模的计算量较大。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言