搜狗AI合成主播走出国门,分身技术开启AI实用化通道人工智能

2019-05-09    来源:AI基地    编辑:吉吉吴
搜狗AI合成主播走出了国门。

随着搜狗AI合成主播技术升级,在完成两次版本迭代后,近日因实现“跨语言”出海而再度引起海外市场高度关注,成为海外媒体行业明星产品。

搜狗官方近日对外公布,其已与阿布扎比媒体集团达成合作,将推出全球首个阿拉伯语AI合成主播。对于此次合作,阿联酋文化和知识发展部部长努拉表示,阿布扎比媒体集团此次研发及应用AI合成主播符合其战略需求,将通过人工智能等数字化技术实现媒体智能化升级。
搜狗语音交互技术中心总经理王砚峰出席此次签约仪式时表示,海外市场的成功扩展,能够提高国际多语种间交流的沟通效率,有助于推动AI合成主播技术的进一步落地,后续还会继续在教育,法律,医疗,娱乐等领域展开发力。

 

阿布扎比媒体集团是阿联酋的大型媒体企业,旗下包括阿布扎比电视台、广播电台、阿文《联邦报》、英文《国家报》及杂志、网站等主流媒体,在海湾和阿拉伯地区拥有较高的知名度和影响力。据悉,本次该集团与搜狗合作打造的AI合成主播,将应用于迪拜电视台有线频道及社交媒体端,用以播报时政新闻为主的栏目。

这次海外合作,不仅意味着搜狗AI分身技术的迭代升级,更是AI技术应用创新最好的写照,相信随着一带一路等国家利好政策的持续颁布,人工智能将会在全球范围内实现技术落地。

AI合成主播持续上线,搜狗AI技术持续突破

AI主播的第一次出现就是在11月的第五届世界互联网大会上,这是由搜狗和新华社联合发布的全球首个全仿真智能AI机器人。在大会上主要进行了新闻的播报,从播报的内容到播报时的声音、表情都和它的主持人原型“邱浩”极为相似,也能实现唇音同步,可以说仿真度达到了90%。

第一代AI合成主播如果意味着搜狗对于AI技术的突破,那么两会期间AI合成女主播“新小萌“就是搜狗AI分身技术的一次重大突破,由以往的坐着播新闻变为站立式播报,同时,训练数据也缩减了大半,涉及的语言语种
逐渐增多,这得益于搜狗对AI技术的持续探索,搜狗AI主播的持续推出使得搜狗分身技术获得了快速复制的能力。

搜狗分身技术开启AI实用化通道

AI合成主播只需要输入文字或语音文本,就可以实时高效输出音视频合成效果,获得实时的播报视频。被行业所惊叹讨论的是,AI合成主播不仅能用和真人一样的声音进行新闻或节目播报,连唇形、面部表情也能够吻合。

具体而言,搜狗分身技术是搜狗人工智能推出的多模态合成技术,结合唇形、面部表情等,运用少量的真人真实音频数据等,生成虚拟的分身模型。

AI合成主播主要有两大核心技术支撑:通过人工智能技术,采集人的面部表情并标签化,并根据语义合成表情;通过机器学习自动生成仿真语音。而这两大核心技术也正是基于搜狗语音合成和图像生成的两大引擎:

  • 在语音合成引擎中,基于用户少量音频数据,使用搜狗个性化语音合成技术,快速学习用户音色、韵律、情感等多维度特征,建立输入文本与输出音频信息的关联;

  • 在图像生成引擎中,使用搜狗人脸识别、三维人脸重建、表情建模等技术对人脸表情动作进行特征学习和建模,建立输入文本、输出音频与输出视觉信息的关联映射,最终生成输出分身视频。

搜狗以AI技术为突破口,走上了AI实用化的快车道,也借由AI技术向全球人民展现了人工智能技术丰富的应用前景,共同推进AI新时代的历史进程。

据了解,搜狗AI合成主播目前主要应用于媒体领域,然而,搜狗的目标不仅仅是媒体领域。王小川前不久表示,作为AI合成主播的技术核心,「搜狗分身」技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域,通过提供个性化的行业解决方案,为不同职业赋能,从而提升整个社会的信息生产力,用AI科技来让人类生活变得更加美好。

1
3