首页 行业报告下载文章正文

AI绘画行业报告:AIGC之AI绘画(25页)

行业报告下载 2022年12月21日 07:30 管理员

未来 NeRF 发展主要是基于 NeRF 问题的改进。NeRF 的简洁性具有优势,但也因此 带来一些问题: 1. 计算量大导致耗时长:NeRF 生成图像时,每个像素都需要近 200 次 MLP 深度模型的 前向预测。尽管单次计算规模不大,但完成整幅图像渲染的计算量还是很可观的, NeRF 针对每个场景进行训练的耗时较长。对此,迭代过后的 Depth-supervised NeRF 能够实现更少的视角输入和更快的训练速度。 2. 只针对静态场景:对于无法拓展到动态场景的问题,主要和单目视频做结合,从单目 视频中学习场景的隐式表示。Neural Scene Flow Fields 将动态场景建模为外观、几何 体和三维场景运动的时变连续函数。该方法只需要一个已知摄像机姿势的单目视频作 为输入。 3. 泛化性差:NeRF 无法直接扩展到没有见过的场景,这显然与人们追求泛化性的目标 相违背。因此一些文章开始对 NeRF 进行泛化性的改进。GRF 学习 2D 图像中每个像 素的局部特征,然后将这些特征投影到 3D 点,从而产生通用和丰富的点表示。与之 类似的还有 IBRnet、pixelNeRF 等,比较核心的想法都是卷积与 NeRF 相结合。目前 这种泛化都还不够成熟,无法在复杂场景中取得理想效果。 4. 需要大量视角:尽管 NeRF 方法能够实现出色的视角合成效果,但是它需要大量的 (数百张)视角来进行训练,这限制了它在现实中的应用。针对视角数量的改进,目 前还局限在比较封闭的测试环境下,如合成物体或者单个物体。扩展其在实操中的可 用性也是未来的一大方向。

让每家公司都进入大模型建设并不现实,我们认为市场将由少数具有先发和成本优势 的供应商主导。OpenAI 作为行业领先者,开发了 GPT 语言模型和 DALL-E 图像生成模 型,并不断提升其模型复杂性和规模,OpenAI 亦是大模型供应商的有力选手,而其他公司 可以付费购买其更底层的 API 等服务。同时,大模型趋势也将给云计算公司如 Googe、亚 马逊,和 GPU 厂商如英伟达带来机会。AI 技术被区分为弱人工智能、通用人工智能、超级人工智能三种模式。弱人工智能也 被称为狭义人工智能,是专攻某一领域的人工智能,例如在围棋上大放异彩的 AlphaGo 都 属于弱人工智能。通用人工智能(Artificial General Intelligence, AGI)也叫强人工智能,或人 类级人工智能,通用人工智能指的是一台像人类一样拥有全面智能的计算机,人类能解决 的智力问题他都能解决。落到 AIGC 领域,人工智能模型将是多模态的,这意味着相同的 模型将被用于文本、图像、视频等等。超级人工智能被定义为“在几乎所有领域,包括科学 创造力、一般智慧和社交技能,都比最优秀的人类大脑聪明得多的智力。 通用人工智能处理复杂情况的能力无比诱人,但实现难度极高,AIGC 或为曙光。受 困于技术、资源、应用方向等因素的局限,通用人工智能的发展在短期内较难突破。AIGC 的兴起,一方面可以给到一个相对特定的、具象范围的 AGI 应用空间,降低难度,再举一 反三;另一方面,AIGC 提供了 AI 广泛施为的机会,无论是数据的大量生产,还是众多专 业力量和资本的投入,都有利于推动技术向前演进。

AI绘画行业报告:AIGC之AI绘画(25页)

文件下载
资源名称:AI绘画行业报告:AIGC之AI绘画(25页)


标签: 人工智能AI行业报告

并购家 关于我们   意见反馈   免责声明 网站地图 京ICP备12009579号-9

分享

复制链接

ipoipocn@163.com

发送邮件
电子邮件为本站唯一联系方式