FaceChain
FaceChain 是一款基于深度学习的工具,专注于生成个人数字形象。用户只需上传一张照片,FaceChain 即可在 10 秒内生成多种风格的个人写真。该工具支持自定义风格模型训练,兼容 ControlNet 和 LoRA 模型,广泛应用于虚拟现实、游戏设计和数字营销等领域。通过 FaceChain,用户可以轻松创建高度真实且可控的个人画像。
DreamTalk 是一个基于扩散的、以音频驱动的表达性说话头部生成框架,能够跨多种说话风格生成高质量的说话头部视频,由清华大学、阿里巴巴和华中科大共同开发。它的主要功能是通过...
DreamTalk 是一个基于扩散的、以音频驱动的表达性说话头部生成框架,能够跨多种说话风格生成高质量的说话头部视频,由清华大学、阿里巴巴和华中科大共同开发。它的主要功能是通过人工智能技术让人物头像能够说话、唱歌,并保持嘴唇的同步以及模仿表情变化。这一框架能够生成高质量的动画,使人物脸部动作看起来非常真实,不仅嘴唇动作逼真,还能展现丰富的表情,使得动画更加生动。
DreamTalk具有说话风格预测的功能,能够根据语音预测说话者的风格,并同步表情,使得动画更加贴近原始音频。这一技术可以应用于多种场景,如歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。
据悉,DreamTalk 由三个关键组件组成:降噪网络、风格感知唇部专家和风格预测器。通过三项技术结合的方式,DreamTalk 能够生成具有多种说话风格的逼真说话面孔,并实现准确的嘴唇动作。
项目主页: https://dreamtalk-project.github.io/
论文地址: https://arxiv.org/pdf/2312.09767.pdfGithub
地址: https://github.com/ali-vilab/dreamtalk
DreamTalk的安装指南视频教程:
https://img.pidoutv.com/wp-content/uploads/2024/03/dreamtalk.mp4