大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
目前这个阶段我们谈到“元宇宙”的时候,还是在消费层面,但是不管是过 去的 PGC 还是 UGC 一直到现在的 AIGC,都是从不同的生产方式来讲的,这一点 是非常有启发性的。国家文化数字化战略就是从供给侧入手的,我们叫发力供给 侧,激活文化资源,推动文化生产体系现代化。 就目前来说,在元宇宙的初级阶段,主要还是从消费层面做,也应是数字化 文化消费的新场景,而且是数字化文化体验的一种形式。但再往前走,实际上已 经进入到一个比较高的阶段,由实现生产和消费统一来推动文化元宇宙的发展会 更好。从目前非常火的 ChatGPT 谈起,ChatGPT 带来的启示有两点,一个是数据如 何保真,这个可能是大家非常关心的问题。数据的保真可能是下一步人工智能发 展一个非常重要的充分必要条件。如果说数据不能做到保真,人工智能发展的方 向可能就会出现一些不应有的失误。 目前 ChatGPT 训练的数据集来源大体上分为六类,包括维基百科、书籍、期 刊、互联网的网站等等,训练的数据集在 GPT-3 里面实际上总量应该有 3000 亿 的词汇,有 1750 亿的参数,如果没有这样一个数据量训练的话,人工智能发展 确实有很大制约。在大家测试聊天机器人水平的过程中,有些人已经提出了一些问题。第一个 大家比较关心的问题是互联网上的数据并不都是准确的,当错误的数据量足够大 的时候,就会导致得出的结论也是错误的。
有一个案例是基于 GPT-3 的医疗聊天, 机器人曾经建议病人自杀。这可能是个案,但如果个案过多,就成了普遍性的问 题,归根结底就是数据的保真问题。而且现在所有的人工智能模型的学习都是基 于一些历史数据,还有一些社会学学者也在研究,有可能这些数据当中存在不必要的偏见,这种偏见也会导致社会的排斥和歧视。所以,扣好文化元宇宙第一粒 扣子非常重要,这是 AIGC 的充分必要条件,也是开发人工智能非常重要的条件。 这方面,跟现在正在推动实施的国家文化数字化战略有相通的地方。也就是 这些数据集到底从哪里来。在中文互联网的数据质量堪忧的情况下,数据到底应 该从哪里来?我们认为应该从中华民族积淀了五千多年的文化资源中转化而来, 这可能是我们下一步应该重点考虑的。 我国是文明古国,也是文化资源大国,这些年我们在推动文化数字化过程中, 特别是文化资源数字化过程中,积攒了大量的文化资源数据,这些数据大多数都 集中在公共文化机构。这次中国共产党中央委员会办公厅、中华人民共和国国务 院办公厅文件当中明确提出公共文化机构要向社会释放数据,依法向社会公众开 放,让大家从这些数据当中提取具有历史传承价值的中华文化元素、符号和标识, 并把它们转化为文化生产要素,从而成为文化元宇宙以及文化创新和创造的文化 素材。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言