Yi大模型
Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可,被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口,能够处理40万汉字的超长文本输入,这在语言模型中是非常重要的,因为它对于理解和生成与特定上下文相关的文本至关重要。
LOADING
Hallo是一个百度开源的AI对口型人脸视频生成框架,用户只需提供一段音频和所选人像,它利用人工智能技术,让图片中的人物能够根据语音的变化做出相应的面部表情和嘴唇动作。
Hallo 是一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学共同推出的开源项目。这个项目专注于AI对口型人脸视频生成技术,利用扩散模型来实现端到端的高质量人脸视频生成。用户只需提供一段音频和所选人像,即可轻松制作出具有极高真实感的人脸视频。
它利用人工智能技术,让图片中的人物能够根据语音的变化做出相应的面部表情和嘴唇动作。传统的方法通常使用参数模型来表示面部动作,但Hallo采用了一种新颖的方法,即端到端扩散范式。这意味着它不再依赖于中间的面部表示模型,而是直接从语音输入生成面部动画。
研究者们还开发了一个分层的音频驱动视觉合成模块,这个模块可以更精确地对齐语音输入和视觉输出,包括嘴唇、表情和姿势的动作。他们提出的网络架构结合了基于扩散的生成模型、UNet-based去噪器、时间对齐技术和参考网络。这种分层音频驱动视觉合成提供了对表情和姿势多样性的适应性控制,使得个性化定制变得更加有效。