EMO在哪体验?阿里对口型视频生成工具EMO下载地址

2024-02-29 13:42
摘要:这几天,阿里的对口型视频生成工具EMO火了。根据官方宣传,EMO只需要上传一张图片和一段音频就可以一键生成对口型视频,而且视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也..

这几天,阿里的对口型视频生成工具EMO火了。根据官方宣传,EMO只需要上传一张图片和一段音频就可以一键生成对口型视频,而且视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为制造虚假视频的利器,因此一些名人可能需要警惕了。(EMO下载地址见文末)

工作原理:

该框架包含两个主要阶段,首先是帧编码阶段,利用ReferenceNet从参考图像和动作帧中提取特征;

其次是扩散过程阶段,通过预训练的音频编码器处理声音嵌入,并结合多帧噪声和面部区域掩码来生成头像。在此过程中,采用了两种注意机制(参考注意和音频注意)和时间模块,以保持角色身份并调节运动速度。

EMO不仅支持多语言歌曲和不同风格的头像生成,还可以处理歌唱、对话等不同场景。它能够根据输入音频的长度生成不同时长的视频,并保持角色的身份特征在长时间内的稳定性。此外,EMO还展示了在快节奏音乐中保持与音频同步的能力,确保角色动画的表现力和动态性。

这一研究对于头像视频生成领域具有重要意义,为多语言、多样化场景下的角色表现提供了新的可能性。它不仅可以应用于娱乐产业,还可以在学术研究和教育培训等领域发挥重要作用。然而,需要注意的是,该框架目前仅用于学术研究和效果演示,还有待进一步优化和扩展其应用范围。

EMO下载地址:https://humanaigc.github.io/emote-portrait-alive/

剩余10%的图文内容打赏作者后可查看联系客服

微信扫码打赏作者

金额:0.99元好的内容,值得赞赏!打赏后不支持退款! 联系客服 扫描下方二维码关注公众号“站长资讯”,及时联系客服解决。请把【打赏记录详情】截图给客服,同时把您打赏的文章【网址】发给客服。客服会在24小时内把完整文章内容发送给您。(客服在线时间为周一至周五9:00-11:30 14:00-17:30) 更新于:8个月前