划重点:⭐️ 提出了 EMAGE 框架,用于从音频和掩码手势生成全身人类手势。⭐️ 引入了新的全面共话数据集 BEATX,结合 MoShed SMPLX 身体与 FLAME 头部参数,提高了建模质量。⭐️ EMAGE 利用掩码手势先验信息进行训..
EMAGE是一种统一的整体共话手势生成模型,通过表情丰富的掩蔽音频手势建模来生成自然的手势动作。它可以从音频输入中捕捉语音和韵律信息,并生成相应的身体姿势和手势动作序列。EMAGE能够生成高度动态和表现力丰富的..