
悟道大模型是由北京智源人工智能研究院发起的超大规模预训练模型研究项目,旨在以原始创新为基础实现预训练技术的突破,填补以中文为核心预训练大模型的空白,探索通向通用人工智能的实现路径。
悟道大模型包括语言、视觉、跨模态、跨语言等多个领域的大模型系列,如悟道·天鹰、悟道·视界、悟道·天鹰AquilaCode等。
悟道大模型不仅具备强大的语言理解和生成能力,还能进行逻辑推理、代码分析、图像生成等多种任务,支持多种类型的文本内容生成,如小说、歌词、诗歌、对联等。
悟道大模型还构建了开源大模型评测体系和生态,包括FlagEval(天秤)大模型语言评测体系及开放平台,以及FlagOpen(飞智)大模型技术开源体系,为大模型行业发展提供技术支持和服务。
悟道大模型的技术原理
悟道大模型是智源研究院开发的一系列人工智能模型,包括语言、视觉和多模态等领域。悟道大模型的技术原理主要基于 Transformer 模型,通过多层自注意力机制和前向神经网络,能够对输入的文本或图像进行编码,实现信息的提取、语义理解和生成回应。悟道大模型的训练过程包括两个阶段:预训练和微调。预训练是在海量的数据上训练一个通用的模型,微调是在特定的任务上对模型进行调整,提高模型的性能和适应性。悟道大模型还采用了一些创新的技术,如 MoE、Diffusion、OpenPrompt 等,来提升模型的规模、效率和能力。
悟道大模型的性能如何?
1、悟道·文汇是全球最大的万亿级人工智能大模型,它能够实现文生文、图生文以及图文生文等多项任务,超越了OpenAI GPT-3、DALL·E以及Google ALIGN等先进模型。
2、悟道·文澜是目前最大的中文通用图文预训练模型,它利用6.5亿对互联网图文数据进行自监督学习,能够在多个国际公开数据集上取得最佳性能。
3、悟道·视界是视觉大模型系列,它能够完成7种主流视觉任务,已经在深度估计、语义分割等核心视觉任务中性能“大幅超越同类”,相比同类模型具有11%~25%的性能提升,超过了图灵奖得主Geoffrey Hinton团队的Pix2Seqv2,艾伦AI研究所的视觉通用模型Unified-IO和谷歌的UViM。
4、悟道·八卦炉是超大规模深度学习训练系统,它能够支持万亿级参数模型的训练,性能超过1EFLOPS,并且能够训练174万亿个参数模型,这与人脑中的突触数量相当。
悟道大模型的发展历程
1、2020年10月,智源研究院发布了悟道1.0,我国首个超大规模智能模型系统,包括语言、视觉和多模态等领域的模型,总参数规模达到了2600亿,是当时国内最大的智能模型。
2、2021年6月,智源研究院联合多个外部实验室发布了悟道2.0,全球最大的万亿级人工智能大模型,包括语言模型GLM、文生图模型CogView等,总参数规模达到了1.75万亿,是OpenAI发布的GPT-3的10倍。
3、2023年6月,智源研究院发布并全面开源了悟道3.0系列模型,包括语言大模型悟道·天鹰(Aquila)、视觉大模型悟道·视界(EVA)以及一系列多模态模型,总参数规模达到了3.5万亿,是悟道2.0的2倍。悟道3.0系列模型是由智源研究院团队自研完成,采用了更高效的架构设计、更高质量的数据清洗、更创新的技术方法,实现了更优的模型性能和应用能力。
数据统计
相关导航

火山方舟是一个由火山引擎推出的大模型服务平台,面向企业提供模型精调、评测、推理等全方位的平台服务。集成了国内多个优秀的大模型,如 MiniMax、智谱 AI、复旦 MOSS 等,覆盖了自然语言处理、计算机视觉、语音识别等多个领域。火山方舟旨在为大模型的开发、应用、运营提供一站式的解决方案,降低大模型使用的门槛,推动大模型的产业化和普及。

小悟空
打赏赞微海报分享

书生通用大模型
书生通用大模型是由上海人工智能实验室发布的大型预训练模型。它包括多个基础模型,如书生·多模态、书生·浦语和书生·天际等。这些模型旨在支持科研创新和产业应用,提供一个全链条开源的研发与应用平台。

VideoCrafter2
VideoCrafter2是腾讯推出的一个先进的视频生成模型,它借助深度学习技术,致力于提高视频的视觉质量、动态效果以及概念组合,能够根据用户提供的文本描述生成高质量、流畅的视频作品。

Gen-3 Alpha
Gen-3 Alpha是Runway公司开发的一款先进的AI视频生成模型。它能够根据用户的输入(如文本描述、图像或视频片段)创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。

星火大模型
讯飞星火大模型是由科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力,快速生成文本、图片、代码等内容。

LTX Video
LTX Video是由 Lightricks公司推出的首个REAL-TIME AI视频生成开源模型。它基于 DiT (Diverse Image Transformer) 架构,能够实时生成高质量的视频。LTX Video 能够以 24 FPS 和 768x512 分辨率生成视频,生成速度比观看速度还要快。

RAGFlow
RAGFlow是一款开源的检索增强生成(RAG)引擎,专为深入理解文档而设计。它为各类企业和个人提供简洁高效的RAG工作流程,与大语言模型(LLM)相结合,针对各种复杂格式的数据提供可靠的问答及有依据的引用。RAGFlow非常适合需要动态内容生成且依赖外部知识库的场景,如智能客服、文档生成和数据分析等,助力用户高效挖掘大量数据中的有价值信息。
暂无评论...