热门

Step-Video-T2V

3个月前发布 10 00

Step-Video-T2V 是由阶跃星辰与吉利汽车集团联合开源的一款先进文本生成视频（Text-to-Video）模型。这款模型在 2025 年 2 月 18 日正式发布，具备强大的多模态生成能力，支持中文和英文输入，适用于广告、影视制作、教育等多个场景。

收录时间：

2025-02-28

AI大模型 AI工具 # Step-Video-T2V开源模型 # Text-to-Video模型 # 多模态视频生成模型 # 文本生成视频

Step-Video-T2V

Step-Video-T2V

Step-Video-T2V是由阶跃星辰与吉利汽车集团联合开源的一款先进文本生成视频（Text-to-Video）模型。这款模型在 2025 年 2 月 18 日正式发布，具备强大的多模态生成能力，支持中文和英文输入，适用于广告、影视制作、教育等多个场景。

其主要特点功能：

强大的模型参数：拥有 300 亿参数，能够生成最长 204 帧的视频，支持高分辨率和流畅的动态效果。
高效压缩技术：采用深度压缩变分自编码器（Video-VAE），实现 16×16 空间压缩和 8x 时间压缩，同时保持视频的高质量。
双语支持：内置双语文本编码器，支持中文和英文输入，适应多语言用户需求。
视觉质量优化：通过视频偏好优化（Video-DPO）技术，减少视频中的伪影，提升视觉效果，使生成的视频更加真实和自然。
多场景适用：在运动、风景、动物、节日、3D 动画等多个类别中表现出色，适用于创意内容制作、广告、教育等领域。

Step-Video-T2V 是一款开源模型，用户可以通过其 GitHub 仓库获取代码和模型权重，方便开发者进行二次开发和应用。

Step-Video-T2V：一款开源的多模态文本生成视频模型

数据统计

相关导航

阿贝智能

人工智能辅助创作

啵啵动漫

开启你的二次元奇幻之旅

Etna模型

Etna大模型是七火山科技推出的一个文生视频的AIGC模型，它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒，每秒可达60帧，分辨率最高可达4K（3840*2160），画面细腻逼真。

抠抠抠

免费抠图工具

堆友-AI绘画神器

多风格AI绘画生成器

MotionSound

智能、专业且轻量化的智能AI语音生成工具，MotionSound能够适应多种场景需求，让您的配音任务不再困难。适用：制作教学课件、广告宣传、语音导航等。

云趣AI助手

云趣AI助手是由羽夜科技推出的综合性 AIGC 平台，集成 GPT-4.0、Claude 3、Midjourney 等多种 AI 模型，为用户提供丰富的 AI 服务。支持 AI 对话、AI 绘画、视频生成、文档分析、语音识别等多种功能，适用于工作、学习、翻译、创作等场景。云趣AI助手支持多端同步，操作简便，提升用户工作和创作效率。

v0.dev

v0.dev是一个用户界面设计在线AI生成工具，它可以帮助我们借助AI人工智能技术来设计用户界面。该工具由知名的前端开发框架Next.js提供支持，我们可以输入文本提示词来快速生成各种网页和应用的UI界面代码。

暂无评论

您必须登录才能参与评论！

none

暂无评论...