中文在线语音识别技术获重大突破!百度输入法准确率超行业最高水平15%

2019-03-10 04:45

  当输入告别键盘,语音、表情、动作都成为输入方式,会是一种怎样的神奇体验?

  1月16日,在百度输入法“AI新输入 全感官输入2.0”发布会上,国内首款真正意义上的AI输入法百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。同时,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破,流式截断的多层注意力建模(SMLTA)将在线%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。

  发布会现场,百度高级副总裁王海峰表示,输入法是离用户最近的产品之一,也是AI落地的“桥头堡”,百度全方位的AI能力正在不断赋能输入法,让输入法更“聪明”。他也给出了输入法行业的“未来画像”,他认为,虽然目前的输入法产品主要应用于手机端,但未来的输入法将应用于各种智能设备与用户的交互,并走向世界,为全球用户提供更多元的输入方式。

  据介绍,截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。同时,百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并已与超过100个全球知名IP达成合作,实现技术与市场的双丰收。

  百度输入法AI探索版是百度AI落地应用的又一重要成果,全语音交互是它最大的特点之一。“虽然当前输入法主流是键盘输入,但对用户需求变化的洞察,让我们有信心较早地推出这款全语音交互的产品”,百度中文输入法负责人蔡玉婷表示,相较2016年,百度输入法日均语音请求量增长了8倍,语音输入法的场景也从聊天和搜索拓展到游戏、娱乐、购物等众多场景。

  全语音交互对于语音识别准确率要求极高,百度推出全语音交互输入法的信心,还来自于百度领先业界的语音技术。现场,百度语音技术部负责人高亮宣布了百度语音输入的四项重大突破和给输入法用户带来的体验提升。

  在线语音领域,百度发布流式截断多层注意力建模(SMLTA),这是中文在线语音识别历史上的两个重大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型;世界上第一次大规模部署在线语音交互注意力模型。这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题,并将在线%。

  离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。

  中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入技术突破,让用户真正实现“自由说”,无论是中英文夹杂,还是普通话家乡话来回切换,百度输入法都能准确识别。据介绍,百度输入法是目前唯一实现了高精度“中英自由说”和“方言自由说”的输入法产品。

  百度语音技术的突破同样让海外用户带来语音输入的便捷体验。本次发布会上,百度海外输入法展示了日语识别、印地语识别和印英混输功能,据第三方评测显示,百度日文输入法的语音识别精度位列行业第一,识别结果用户可接受度占比高达 90%,已成为日本最大的第三方输入法产品;印度用户语音功能的使用率已达21%,百度输入法帮助印度用户实现了自由沟通。

  伴随着百度语音、视觉、自然语言处理、知识图谱等百度AI技术落地输入法,“全感官”的输入变成现实。除了语音输入,百度输入法AI探索版还推出了拍立活、秀场、凌空手写等新功能玩法。无论是心爱的偶像,还是日夜陪伴的宠物,“拍立活”功能都可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用图像分割技术,让用户“穿越”到不同的虚拟场景之中,科技、清新、赛博朋克多种风格随意挑选,表情创作更具场景感、更加生活化;凌空手写如同隔空打怪,在空中书写也能被流畅识别,目前整体识别率已达到大规模应用的要求。

  百度输入法全感官交互潮流也已进入海外并获得认可。据悉,借助AI技术的加持,百度海外输入法已经在全球建立起最活跃、最权威的表情社区。超级IP《变形金刚》系列首部独立电影《大黄蜂》已与百度海外输入法联手推出“大黄蜂”系列主题贴图和AR表情。截止目前,百度海外输入法已经和Hello Kitty、小黄鸭、小王子、格林奇等全球100余个知名IP达成合作,推出了一系列深受用户喜爱的IP皮肤和表情,同时深耕本地化运营,针对海外用户还设计了本地网红合作推广等定制化传播。2018年,百度海外输入法的推广视频,总观看次数已超过1亿。

  输入法本质上是一款人机交互的工具,AI时代正在到来,人机交互的形态也将随之革新。“未来,百度输入法将不仅基于手机端,还将致力于连通包括智能家居、车联网等多种终端场景,集多种输入方式为一体,帮助用户在各种场景下高效、自如地传递信息。” 百度高级副总裁王海峰表示。

  关注ITBear科技资讯公众号(itbear365 ),每天推送你感兴趣的科技内容。

  特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

  全球领先的移动应用数据和分析平台 App Annie 今天正式发布《2019 年移动市场报告》,总结了过去一...

  1月16日,百度输入法“AI新输入 全感官输入2.0”发布会在京举行,与此同时,百度海...

  当输入告别键盘,语音、表情、动作都成为输入方式,会是一种怎样的神奇体验?

  一进腊月,就忍不住在心里默默倒计时,焦急地等待春节到来。一年到头,终于可以在年底回家时说起熟...

  据外媒《The News International》报道,在以美国为主导的呼吁抵制华为5G电信设备的行动中,欧洲各...

  近日,外媒报道称爱立信与德国电信完成了mmWave毫米波的实验室5G回程测试,速率达到40Gbps、延迟控...

  自百度地图上线汤唯导航语音之后,已经有越来越多的人爱上了出行时和汤唯“对话”,但是...

  人类进化了几百万年才站在生物链的顶端,绝不是为了简简单单活着而已。从一千零一夜中的魔法飞毯,...

  近日,鲸准研究院发布的《周期、重构、起航2018中国新经济创投白皮书》指出,中国处...

  互联网世界太大,每天都有瓜,真让人应接不暇!昨晚一则消息引发全球关注:“世界首富、亚马逊C...

  互联网最初发展的十年,匿名一直是其基本特征。随着互联网进入社交时代,实名社交逐渐成为主流。社...

  近日,以科技创新为驱动力的爱奇艺与致力于消费级MR智能眼镜研发的太若科技(Nreal)达成深度合作。爱...

  2019亚洲杯已经打响,小组赛已经于北京时间1月6日开始,而国足将再次出征创作奇迹,非常令人期待。...

  刚刚过去的2018年对于虚商来说,无疑是可喜可贺的一年。在这一年,望眼欲穿的正式商用牌照正式下发...

  2019年1月5日,由阿拉丁主办的小程序开发者年度盛会在京举行。阿拉丁小程序统计平台创始人&CEO...

  1月4日,雷军发微博称“小米内置小爱同学(智能语音助理)的激活设备数已经超过了一亿台!这是不...

  1月4日,百度正式对外宣布,截至2018年12月31日,搭载DuerOS(小度人工智能助手)的智能设备激活量超...

  提起变形金刚里的大黄蜂,无数人都会露出一脸渴望拥有的模样。人性化的大黄蜂汽车,不仅是孩子眼里...

  1月3日消息,Realme在官方推特宣布,Realme用户已经达到了400万人,用时仅仅7个月时间。

分享到:
文章评论 · 所有评论
评论请遵守当地法律法规
点击加载更多
© 2016-2018 12小时新闻网 http://www.12hnews.com/ 中国互联网举报中心
违法和不良信息举报:lobtom@163.com