LOADING

热门

Magi

6个月前发布 12 00

Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。该模型通过识别漫画页面上的面板、文字块和角色，实现了全自动的剧本生成功能。

收录时间：

2024-11-29

打开网站手机查看

AI大模型 # Magi # Magi模型 # 漫画转录成文字 # 漫画转文字技巧 # 漫画页转录成文字并生成剧本

Magi

Magi

Magi 的模型是一个可以自动将漫画页转录成文字并生成剧本。Magi 模型是牛津大学工程科学系的视觉几何组开发的，该模型通过识别漫画页面上的面板、文字块和角色，实现了全自动的剧本生成功能。其主要功能包括面板检测，识别漫画页面上的各个面板，以及文本块检测，识别面板中的文本块，通常包含对话或叙述性文本。此外，模型还能够检测页面上的角色形象，并根据其身份进行聚类，以区分不同的角色。

Magi 模型还可以将文本与说话者进行关联，确定哪些文本是由页面上的哪个角色说出的，保证剧本的准确性。同时，模型还会按照漫画的阅读顺序对文本块进行排序，确保剧本的叙述逻辑与原漫画一致，让读者通过阅读文本完整地体验漫画故事。

除了 Magi 模型本身，项目还包含一个名为 Mangadex-1.5M 的数据集，其中包含约150万漫画页面，涵盖多种流派和艺术风格。这个数据集的设计旨在为 Magi 模型的训练提供支持，解决漫画页面的自动理解和剧本生成问题，包括面板检测、文本块和角色检测、角色身份聚类以及文本与说话者之间的关联。

通过这一项目，研究人员希望推动漫画领域的自动化处理和理解技术的发展。

论文：https://arxiv.org/abs/2401.10224

Magi GitHub源码：https://github.com/ragavsachdeva/magi

项目入口：https://top.aibase.com/tool/magi

Magi：自动将漫画页转录成文字并生成剧本

数据统计

相关导航

Moonvalley.ai

Moonvalley.ai是一款功能强大的文本到视频生成式AI模型。它可以从简单的文字描述中生成高清视频和动画，涵盖各种不同的风格，包括超现实视频、动漫以及介于两者之间的所有内容。用户只需提供简要的文字提示，即可创造电影级的视觉效果。该模型主打高清、16:9电影画质，视频质量比大多数其他一代AI视频工具要好得多。

文心千帆

文心千帆是百度智能云推出的产业级知识增强大模型，包括基础大模型、任务大模型、行业大模型，以及丰富的工具与平台，支撑企业与开发者进行高效便捷的应用开发。它能够从海量数据和大规模知识中融合学习，效率更高，效果更好，具备知识增强、检索增强和对话增强的技术特色。

商量拟人大模型

商量拟人大模型是商汤科技推出的一款AI拟人大模型，它支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能，可实现行业领先的角色对话、人设及剧情推动能力。该模型广泛应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。

盘古大模型

盘古大模型 3.0 是一个面向行业的AI大模型系列，包含自然语言、视觉、多模态、预测、科学计算大模型等五个基础大模型，可以为用户提供知识问答、文案生成、代码生成，以及多模态大模型的图像生成、图像理解等能力。

Qwen2

Qwen2是由阿里云通义千问团队开源的新一代大语言模型。这个系列包括了不同规模的解码器语言模型，从0.5B到72B不等，涵盖了中文和英文以及其他27种语言的高质量数据。Qwen2的设计旨在提高模型在自然语言理解、代码编写、数学解题和多语言处理方面的能力。

FaceChain

FaceChain 是一款基于深度学习的工具，专注于生成个人数字形象。用户只需上传一张照片，FaceChain 即可在 10 秒内生成多种风格的个人写真。该工具支持自定义风格模型训练，兼容 ControlNet 和 LoRA 模型，广泛应用于虚拟现实、游戏设计和数字营销等领域。通过 FaceChain，用户可以轻松创建高度真实且可控的个人画像。

IMYAI智能助手

IMYAI智能助手是一款功能强大、简单易用的AI服务平台,集成了GPT4、Claude、Midjourney、Stable Diffusion等先进技术。无论您是需要写作灵感、绘画创意,还是寻求办公助理、生活规划,IMYAI都能提供专业、高效的解决方案。

Ferret-UI

Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态AI大语言模型。它专为增强对移动端用户界面（UI）屏幕的理解而设计，具备引用、定位和推理功能。这个模型能够理解手机屏幕上的内容并执行任务，专注于移动端和用户交互。

暂无评论

您必须登录才能参与评论！

none

暂无评论...