书生通用大模型

5天前发布 2 00

书生通用大模型是由上海人工智能实验室发布的大型预训练模型。它包括多个基础模型,如书生·多模态、书生·浦语和书生·天际等。这些模型旨在支持科研创新和产业应用,提供一个全链条...

收录时间:
2024-11-29
书生通用大模型书生通用大模型
书生通用大模型

书生通用大模型是由上海人工智能实验室与商汤科技联合发布的大型预训练模型。它包括多个基础模型,如书生·多模态、书生·浦语和书生·天际等。这些模型旨在支持科研创新和产业应用,提供一个全链条开源的研发与应用平台。书生通用大模型体系的目标是构建一个通用视觉技术体系,帮助开发者快速降低通用视觉模型开发门槛。

此外,书生·视觉大模型(InternVL)是该体系的一部分,它在视觉核心任务上取得了开源领先的性能。例如,InternVL-6B具有60亿参数量,并能够在纯视觉任务和图生文任务上逼近或超过谷歌闭源ViT-22B2。这些模型不仅能够处理复杂图片中细微的视觉信息,还可以识别和解读复杂页面中的信息,甚至解决其中的数理问题。

书生通用大模型官网界面

书生通用大模型的主要功能

1、全链条开源:提供从数据到预训练、微调、部署和评测的全链条开源体系,支持学术研究和产业应用。

2、多模态能力:支持光标指令交互、利用语言定义任意任务和轻量级自适应融合等关键技术,实现开放世界理解、多模态交互和跨模态生成。

3、高性能参数量:例如,书生·浦语语言大模型的104B版高质量语料从1.6万亿token增至了1.8万亿,语境窗口长度从2K增至了8K,支持20多种语言。

4、广泛的应用领域:已实现对城市实景建模、自动驾驶、智慧医疗、气象预报等领域的智能化进程。

5、可编程的通用工具调用能力:在复杂任务上,模型可以自动编写一段Python程序,综合调用多种能力,大幅拓展模型能力。

应用场景

  1. 自动驾驶:通过模型的高性能参数量和多模态能力,可以实现更加智能的自动驾驶系统,提高安全性和效率。
  2. 智慧医疗:在医疗领域,书生通用大模型可以帮助进行诊断、治疗建议和患者管理,推动智慧医疗的发展。
  3. 气象预报:该模型可以用于气象数据分析,提高气象预报的准确性和可靠性,对于灾害预防和应对具有重要意义。
  4. 城市实景建模:书生通用大模型支持创建高精度的城市实景建模,这对于城市规划、交通管理和环境保护等领域都有应用价值。
  5. 多语言支持:该模型支持20多种语言,可以在全球范围内应用,特别是在需要跨语言交流的国际合作中非常有帮助。

数据统计

相关导航

EMO

EMO

EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的人物会展现出丰富的面部表情和多变的头部动作,仿佛照片中的人物正在唱你所制定的语言或歌曲。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...