JoyGenJoyGen是一个音频驱动的3D深度感知说话人脸视频生成框架。它通过音频驱动生成嘴唇运动和视觉外观合成,旨在实现精确的嘴唇-音频同步和高视觉质量。040AI大模型AI工具# 3D说话人脸生成# JoyGen# 音频驱动3D说话人脸视频模型