首页 行业报告下载文章正文

2018-2019年百度大脑AI技术成果白皮书报告(48页)

行业报告下载 2019年10月30日 07:26 管理员

百度提出的持续学习语义理解框架艾尼(ERNIE)充分利用了百度海量数据和飞桨多 机多卡高效训练优势,创新地融合大数据਀知识,持续地构建词法、句法和语义三个层次 的多种预训练任务,通过持续的多任务学习技术进行训练更新,如图 11 所示。目前, ERNIE 已累计学习超过 13 亿多的知识,全面刷新中英文 NLP 任务效果。百度 7 月发布的 ERNIE 2.0 进一步刷新中英文 NLP 任务效果。目前,ERNIE 2.0 在自然 语言推断、自动问答、阅读理解等多种中文 NLP 任务和英文通用自然语言理解任务 GLUE 上,效果超越 BERT 和 XLNET,具体如表 1,表 2 所示1。百度近期还发布了面向企业应用的 ERNIE 开源工具集,包括功能全面的 Fine-tuning 工具、速度领先的预测工具、灵活的部署 工具和一键式的压缩工具等。

百度在 2015 年发布了全球首个互联网神经网络翻译系统,突破了大规模数据训练、集 外词问题、漏译问题、数据稀疏等一系列国际公认难题[21][22],翻译质量提升幅度超过过 去十年总和。 过去的一年,百度结合语音技术、机器翻译技术,研发了全球首个高质量、低时延的 端到端同传系统,为用户带来沉浸式同传体验。在语音容错方面,百度提出了联合词向量 编码模型[23],提升模型鲁棒性,缓解语音识别错误;在实时性方面,百度提出了具有预 测和可控时延的翻译模型[24];在语篇翻译方面,百度提出了基于多轮解码校对网络的语 篇翻译模型[25],以解决译文一致性和连贯性问题;在端到端机器同传模型方面,百度首 次提出了基于知识蒸馏的同传模型[26],可以有效克服数据稀疏问题,显著提升翻译质量。

百度与途鸽合作研发了全球首个共享 Wi-Fi 翻译机,创造性地将 Wi-Fi 和语音翻译集成, 实现了 80 多个国家的 4G 网络高速连接和 10 种语言的高质量语音翻译。研发了自动语言 识别技术,首次实现了一键互译。相比于传统的翻译机,极大地提升了用户体验和交互效 率。凭借语音翻译的一系列技术突破,在美国权威杂志《麻省理工科技评论》(MIT  Technology Review)2018 年“全球十大突破性技术”(10 Breakthrough Technologies 2018) 官方榜单中,百度被列为实时语音翻译领域“关键玩家”,成为本年度唯一一家入选的中 国公司[27]。2018 年 8 月,百度翻译机作为官方合作伙伴,支持“中非合作论坛北京峰会” 的多语言翻译。 百度翻译支持 28 种语言、756 个翻译方向,覆盖全球 47 亿人口,每日实时响应超过 千亿字符的翻译请求,同时,提供了开放云接口服务,支持超过 25 万个第三方应用,极大 地促进了相关产业发展。

2018-2019年百度大脑AI技术成果白皮书报告(48页)

文件下载
资源名称:2018-2019年百度大脑AI技术成果白皮书报告(48页)


标签: TMT行业报告

并购家 关于我们   意见反馈   免责声明 网站地图 京ICP备12009579号-9

分享

复制链接

ipoipocn@163.com

发送邮件
电子邮件为本站唯一联系方式