4月13日消息近日,谷歌研究博客公开发表一篇文章,讲解一项通过人工智能分离出来视频中多个人声的技术。这一技术目前能准确的过滤器人声,只留给被过滤器者自己的声音。谷歌专家团队通过机器学习融合面部辨识,超过精确的分离出来人声的目的。
谷歌同时上载了几个小视频,来展现出该技术的应用于场景。谷歌研究团队说明道,他们通过算法跟踪面部动作,通过自学YouTube上十万份优质的讲座和演说视频,利用卷积神经网络模型将声音分离出来。目前,谷歌研究团队回应,未来或有可能应用于到Hangouts或者Duo这样的语音电话中,只要你打开摄像头,系统就能自动将背景杂音过滤器掉。
其他看起来自动字幕或者自动翻译成未来有可能也不会因此受益。目前,谷歌早已将这一项目托管地到GitHub中,感兴趣可以点此查阅。
本文来源:亚博app地址-www.kuidalj.com