
千影 QianYing 是一款由巨人网络 AI Lab 推出的有声游戏生成大模型,包含游戏视频生成大模型 YingGame 和视频配音大模型 YingSound。通过先进的人工智能技术,千影 QianYing 能够自动生成高质量、有声的游戏视频。YingGame 通过自定义角色、动作控制和物理模拟,创造互动性强的游戏内容;YingSound 则为视频添加高保真音效,实现精确的跨模态对齐和时间同步。千影 QianYing 旨在大幅提升游戏创作效率,助力游戏开发进入创作平权时代,让创意无限延展。
YingGame
YingGame 是面向开放世界游戏的视频生成大模型,由巨人网络 AI Lab 与清华大学 SATLab 联合研发。它首次实现了角色多样动作的交互控制和个性化定制,以及强大的物理模拟特性。用户可以自定义游戏角色,并通过理解用户输入(如鼠标、键盘按键等)控制角色的多种动作和精细的主体控制,生成具有复杂运动和动作连续性的交互性游戏视频。
YingSound
YingSound 是由巨人网络 AI Lab、西北工业大学 ASLP Lab 和浙江大学联合研发的视频配音大模型。它具备超强的时间对齐和视频语义理解能力,能够为各种类型的视频(包括真实场景视频、动漫视频和游戏视频)生成高精细度的音效。YingSound 支持从视频或视频文本结合的方式生成高保真音效,有效提升少样本场景下的生成质量,实现精确的跨模态对齐效果。
技术创新与应用:
千影 QianYing 通过技术层面的多项创新,包括跨模态特征融合、细粒度角色表征、运动增强与多阶段训练策略,结合高效高质量的游戏视频训练数据生产管线,确保生成内容具备高交互能力和多样化应用场景。
前景与展望:
随着千影 QianYing 的发布,巨人网络实现了自研语义大模型、语音大模型及视频大模型的多模态全矩阵布局,加速“游戏+AI”从降本增效向颠覆式创新的转化。未来,千影 QianYing 将极大提升游戏发行内容的创作效率,并为游戏生产管线、交互方式、游戏玩法带来深远影响。
巨人网络 AI 实验室将持续推进模型能力的升级迭代,同时启动“千影共创计划”,对外开放模型技术、模型应用和原创游戏项目的合作共创、应用落地和人才招募,推动游戏创作的平权化,让更多人实现游戏开发梦想。
数据统计
相关导航

Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态AI大语言模型。它专为增强对移动端用户界面(UI)屏幕的理解而设计,具备引用、定位和推理功能。这个模型能够理解手机屏幕上的内容并执行任务,专注于移动端和用户交互。

Moonvalley.ai
Moonvalley.ai是一款功能强大的文本到视频生成式AI模型。它可以从简单的文字描述中生成高清视频和动画,涵盖各种不同的风格,包括超现实视频、动漫以及介于两者之间的所有内容。用户只需提供简要的文字提示,即可创造电影级的视觉效果。该模型主打高清、16:9电影画质,视频质量比大多数其他一代AI视频工具要好得多。

S2V.AI
S2V.Ai是由MiniMax公司推出的一项创新AI视频生成技术,通过S2V-01模型,用户只需上传一张图片,就能将图片中的主体转化为视频中的角色,并实现高度一致性和自然过渡。这项技术为用户提供了快速、低成本、高质量的视频生成解决方案。

DreamTalk
DreamTalk 是一个基于扩散的、以音频驱动的表达性说话头部生成框架,能够跨多种说话风格生成高质量的说话头部视频,由清华大学、阿里巴巴和华中科大共同开发。它的主要功能是通过人工智能技术让人物头像能够说话、唱歌,并保持嘴唇的同步以及模仿表情变化。这一框架能够生成高质量的动画,使人物脸部动作看起来非常真实,不仅嘴唇动作逼真,还能展现丰富的表情,使得动画更加生动。

Video-LLaVA
Video-LLaVA是由北京大学ChatLaw课题组开发的一款视频问答模型。它基于Transformer架构,能够处理视频和问题,通过自注意力机制来捕捉二者之间的关联信息,并可以回答有关其内容的问题,它准确地描述了这些媒体中的视觉效果。这个模型通过在大量视频数据上进行预训练,使得它能够理解丰富的视频特征和问题语义,进而在视频问答任务上取得了先进的性能,该技术还可用于标记图像和视频。

讯飞开放平台
讯飞开放平台,一个领先的人工智能技术与生态服务平台,致力于为开发者与企业提供全面的智能交互能力。我们不仅提供语音、图像、自然语言识别等核心交互技术,还拥有丰富的行业解决方案与SaaS产品,助力您轻松构建各类智能应用。

Face Adapter
Face Adapter 是一种专门为预训练的扩散模型设计的适配器,主要用于面部重演和面部交换任务。它能够实现高精度和高保真度的面部编辑,提供精细的个体识别和属性控制功能。

NineF AI
NineF AI 是一站式免费主流 AI 大模型集成平台,集成了 GPT、Claude、Llama 等全球顶尖 AI 模型,提供多角度智能解答,助您提升工作效率和决策准确性。界面简洁直观,支持图片和文档上传,满足各类创作和研究需求,是激发创新灵感的理想人工智能助手。
暂无评论...