数字人起飞!字节Loopy对口型功能上线 可根据语境匹配表情和情绪
月初时,字节跳动推出的新项目Loopy曾引发广泛关注。这个旨在实现数字人声音与画面、表情及情绪完美匹配的对口型项目,如今已在即梦平台上正式亮相,并收获了如潮好评。
人工智能 - Ai工具集 - 未来办公人的智能办公生活导航网站!
办公人的必备神器 - Ai-321.com
AIbase亲自体验后表示,Loopy的效果令人惊艳,堪称当前中文对口型服务的佼佼者。过去,对口型视频常给人一种声音与嘴型割裂的感觉,但Loopy的出现彻底改变了这一局面。
这款由字节跳动与浙江大学科研团队联手打造的基于音频驱动的视频扩散模型,不仅能让数字人的嘴型与声音精准同步,还能根据语境自动赋予其相应的语气、情绪和表情。它能细致入微地控制虚拟形象的每一个动作,包括非语音动作如叹息,以及情绪驱动的眉毛、眼睛和头部运动。
在即梦平台上,用户可以轻松体验Loopy的魅力。AIbase上传了一张女孩照片进行测试,发现即梦提供了两种对口型方式:文本朗读和上传本地配音。操作简便,只需上传角色图片或视频,输入文本或配音即可。
测试结果显示,无论是说话还是唱歌,Loopy都能完美呈现人物的细微表情和动态。法令纹等细节的处理也相当真实,让人仿佛置身于真实的对话场景中。此外,Loopy还考虑到了喉结、眉毛等细微变化,进一步增强了视频的真实感。
更换不同角度的照片进行测试后,AIbase发现正面的角色呈现更具代入感。人物在唱歌时的闭眼、摇头等动作也显得异常真实。同样令人惊艳的是,Loopy在男生版测试中也展现出了出色的效果,让人不得不佩服其强大的功能。