达摩院公布语音AI四大进展,实现理论、技术、应用全链路突破

2019-12-03 00:14:00 中文科技资讯 分享

  9月26日,达摩院在杭州云栖大会公布2019年阿里语音AI四大进展,在语音AI的理论、技术、应用等整个链路均有突破。y70中文科技资讯

  当日,阿里巴巴在杭州云栖大会上首次公布人工智能调用规模:每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,已经成为大发pk10最大的人工智能公司。y70中文科技资讯

  达摩院语音实验室负责人鄢志杰介绍,今年以来实现了四大技术进展:声学信号处理理论、语音合成技术、语音自学习平台及通用语音交互方案。y70中文科技资讯

  语音AI团队提出了声学信号处理的理论创新——指向性差分麦克风阵列,用“应用指向性麦克风阵列”替代传统的全向型麦克风,使得阿里AI能够实现超大型空间内的远距离清晰收音。y70中文科技资讯

  不久前,达摩院发布了自研的新一代KAN-TTS语音合成技术,把语音合成与真人录音的相似度提升到95%以上,并将声音定制成本降低10倍以上、周期压缩3倍以上。y70中文科技资讯

  阿里云语音自学习平台升级到了2.0版本,全面开放自学习优化手段,人人都能自主定制语音模型,目前平台已经服务超过2.6万个场景。同时,达摩院推出了通用语音交互方案,提供端云接入、全方位服务、可定制的一站式解决方案。y70中文科技资讯

  “达摩院的AI就是大家的AI,达摩院要把语音技术能力做得高一点,但把技术到产业落地的门槛做得低一点。”鄢志杰表示,达摩院最先进的AI技术全都“零时差上云”,通过阿里云对外输出服务。y70中文科技资讯

  他打开阿里云官网,现场演示了“开箱即用”的语音合成服务:假设要定制一套给小朋友说故事的声音,先在页面上选择合适的声音,然后输入任意文本,比如“欢迎大家来到云栖大会,我长大了也要到达摩院当一个扫地僧”,马上,语音AI就用奶声奶气的合成童声念出了这句话。y70中文科技资讯

声明:本站部分资源来源于网络,版权归原作者或者来源机构所有,如作者或来源机构不同意本站转载采用,请通知我们,我们将第一时间删除内容。本站刊载文章出于传递更多信息之目的,所刊文章观点仅代表作者本人观点,并不意味着本站赞同作者观点或证实其描述,其原创性及对文章内容的真实性、完整性、及时性本站亦不作任何保证或承诺,请读者仅作参考。
编辑: