首页 行业报告下载文章正文

中国知识图谱行业研究报告(46页)

行业报告下载 2020年04月21日 06:32 管理员

2019年涵盖大数据分析预测、领域知识图谱及NLP应用的大数据智能市场规模约为106.6亿元,预 计2023年将突破300亿元,年复合增长率为30.8%,其中2019年市场中以金融领域和公安领域应用份额占比最大,金融领 域因标准化数据积累丰富,行业认知与直接需求最为明显等因素,成为数据智能最早落地并产生价值的行业;公安领域经 过三年的感知智能基础设施建设,已经初步形成人工智能应用环境,在党中央和公安部的号召指导下,公安大数据建设将 成为下一阶段的主题,这一趋势也在2019年相关招标项目中得以体现。随着整体市场数据基础的完善和需求唤醒,大数据 智能领域规模持续走高,但在行业可落地性和理性建设的限制下,预计市场增速将呈现下降趋势,期间咨询性需求将会大 量出现,从整体发展来看增速处于良性区间,对真正有价值的公司和产品有正向意义。

搜索引擎是互联网发展中最具代表性的应用之一,它解决了人们如何方便获取信息的问题,一度成为大部分流量的入口。 但随着网络中信息沉积越来越多,人们真正需要的,隐藏在大量无用信息中有价值的部分,我们称之为知识的内容,往往 得不到直观展现,这成为了搜索引擎领域重点要解决的问题。2012年5月,谷歌率先提出知识图谱概念,用以更好的描述 现实世界中实体关联性问题,进而提高信息搜索中的知识获取效率,随后搜狗、微软、百度纷纷推出相关概念架构,知识 图谱被视为下一代搜索引擎的核心技术。传统搜索引擎一般采用网页索引,按照“网页 --(预处理)--> 临时库 --(索引) --> 索引好的库 --(由用户行为触发检索)--> 为用户展示网页结果”的流程执行,信息源来自网页,展现内容也是网页 链接。而基于知识图谱的搜索作为和网页索引同级、并行的另一套知识索引,更注重信息间的关联性和自然语言理解,通 过图存储的形式从新组织互联网中的信息,再以人类的语言习惯进行查询和展现,从而提高搜索体验,因为知识的存储形 式发生了变化,所以知识索引信息来源和展现载体都不再局限于网页文字,语音交互和更加丰富的IoT场景将会是未来的 发展方向。

目前,互联网上只有极少数知识被人工整理成了机器可以解析的格式,如各类百科栏目和垂直领域数据库,这些资源支撑 了当下绝大部分通用知识图谱的搭建,但这些信息也仅仅是沧海一粟,无论是覆盖范围、更新频率、可靠程度都无法满足 日益增长的自动化和智能化需求,更严峻的是新一代互联网用户逐渐丧失了参与编辑的精神,甚至不知道可以编辑百科内 容,在此趋势下基于百科的知识图谱将会变成一种静态数据留档,其支撑的知识搜索也将会大量依赖于权威组织编辑,成 本和效率将会成为致命伤,因此应用准确且自动化的NLP技术,在更广泛的网页文本信息中,替代人工进行知识抽取,成 为了知识搜索领域重要的破局点。知识搜索引擎Magi提供了一种NLP+评价系统的半监督学习方式,通过互联网对有监督 学习的原始NLP模型进行“放养式”训练,再由“一个知识点在不同表达中被印证,则证明其可信度较高”而形成的评价 系统去收敛训练成果,从而完成较低成本,可持续的广域下NLP模型训练,经过搜索引擎Magi.com的公测体验,以及B端 知识抽取的定制服务,Magi逐渐形成了独立NLP产品的服务模式,为知识工程轻需求用户,和知识图谱搭建者提供了完善 的RPA服务。

中国知识图谱行业研究报告(46页)

文件下载
资源名称:中国知识图谱行业研究报告(46页)


标签: TMT行业报告

并购家 关于我们   意见反馈   免责声明 网站地图 京ICP备12009579号-9

分享

复制链接

ipoipocn@163.com

发送邮件
电子邮件为本站唯一联系方式