在 2023 I / O 开发者大会上,谷歌宣布正在开发一项名为 Universal Translator 的实验技术。
顾名思义,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。
Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的口型。
考虑到此工具可能被滥用来创建虚假视频,谷歌表示将限制对 Universal Translator 的访问。因此,只有谷歌授权合作伙伴才能将其用于建设性项目,而普通用户无法使用。
免责声明:素材源于网络,如有侵权,请联系删稿。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。