首页 行业报告下载文章正文

全球AIGC数据版权规范梳理报告(16页)

行业报告下载 2024年02月04日 07:41 管理员

用于 AI 模型训练的数据集有多种方式避免侵权,或直接补偿版权持有人。  专有数据:1)版权合作协议:Shutterstock、Axel Springer 等多家版权提 供商与 AI 公司建立合作;2)API 付费访问:部分专业性强的数据提供商会 对 API 访问进行收费,23 年 Reddit、Twitter 的 API 访问由免费转向付费。 开源数据:1)开放许可协议:包括 CC、ODC、CDLA 等;2)特定的数据抓 取策略:如遵守网站的 Robot.txt 文件;3)社区监督:提升数据集透明度。 直接补偿创作者:1)事前补偿:技术难度低,但难以界定合理的补偿额 度,如 Shutterstock 建立的贡献者基金;2)事后补偿:对 AI 生成内容进行 溯源,定价合理但技术尚不成熟,如卡耐基梅隆大学发表的归因模型算法。 专用数据集:直接出售适用于模型训练的数据集,或打包成 MaaS 服务。 海外版权合作协议盈利模式稳定、商业化前景初步展现。AI 生成内容或对版 权提供商的传统业务造成一定威胁,版权提供商与 AI 公司的合作是互利共 赢。1)多媒体素材库 Shutterstock:通过出售模型训练素材创收,推出 AI 生成图片专区,提供由 OpenAI 支持的 AI 工具;2)出版商 Axel Springer: 向 OpenAI 出售其出版物作为训练素材,共同运用 AI 技术提升用户体验。 从 Shutterstock 看版权库与 AI 公司的合作:AIGC 的利好整体强于利空。 1)利好:Shutterstock 的数据授权收入已较明显体现在业绩端,驱动估值 修复和股价回升,23Q3 出售模型训练素材的收入占公司总收入的 19.5%; 2)利空:23 年以来 Shutterstock 传统业务低迷更多受同业竞争影响,同类 公司 Getty Image 业绩稳健,AIGC 对版权库行业的威胁和替代尚不明显。 国内外模型训练数据版权规定尚待完善,版权商股价有望得到密集催化。 22M12 一篇论文显示 Stable Diffusion 以像素点级别复制名画的细节。对 AIGC 的版权问题的争议和相关法规主要可以分为两类:1)AI 生成内容的版 权界定:美国不承认 AI 生成内容拥有著作权,而中国倾向于保护 AI 生成内 容的著作权;2)模型训练数据的版权规定:美国、欧盟均明确要求使用受 版权保护的材料来训练模型,而日本则认定训练数据不受版权保护。

全球AIGC数据版权规范梳理报告(16页)

文件下载
资源名称:全球AIGC数据版权规范梳理报告(16页)


标签: 人工智能AI行业报告

并购家 关于我们   意见反馈   免责声明 网站地图 京ICP备12009579号-9