
aminer智慧手语是一项基于高质量多类型手语语料库、全链路高精度手语翻译算法及跨模态拟人生成技术的创新。它旨在打造高逼真的手语播报数字人生成模型,让听障人群能够无障碍地共享世界。
aminer智慧手语的创立背景
手语是听力障碍人士的主要的交际工具,是用手势比量动作的视觉语言,表形度高、词性结构不发达、拥有自身独特的表达逻辑和特点。
我国听障人群数量达2700万,无障碍设施和专业场景的手语服务资源匮乏,听障人士难以全方位地接收资讯信息。Al技术的快速发展,使高质量语料匮乏、手语语序复杂、高逼真数字人生成难的问题得以解决。Al手语数字人实现了文字内容的语义理解,将其翻译合成手语,并通过虚拟数字人华同学进行播报。
aminer智慧手语的主要功能
1、AI手语播报:为视频增加手语播报
AI手语播报,是视频 / 音频的手语合成,要求实时性,对于语言精炼度要求高。采用基于语言预训练大模型的语义蒸馏算法、Al手语翻译算法、跨模态拟人生成技术,将文本进行精简、翻译,合成数字人手语动作,并与原音视频逐句对齐播出。可用于新闻、电影、电视剧等录播场景的视频手语合成,也可支持电视新闻播报、体育赛事播报、电商直播等实时直播场景。
2、AI手语翻译:连接健听人士和听障人士的翻译官
Al手语翻译,是将文本/语音翻译为数字人手语,生成的手语保留完整中文语义并符合手语表达特点。手语翻译算法以预训练模型为基础,针对中文文本与手语语序差异大、手语语序规则不统一等问题而研发。手语翻译转写速度达到毫秒级,识别准确率达到98.7%。支持移动端、桌面端、后台端全平台,适用于公共服务引导、日常会话、展览展示、智能问答等多种场景。
3、AI手语词典:手语学习的工具书
AI手语词典以《国家通用手语词典》为基础,包含手语词目、拼音、手势说明、相关词等信息,以观看者的角度呈现AI手语数字人手语视频。小程序提供多种检索方式,并依据不同场景分类手语词,便于学习使用。适用人群:听障人士、需要学习手语的人士等、以及手语爱 好者等。
数据统计
相关导航

ZERO10是塞浦路斯的一个AR时尚试穿平台,致力于通过让消费者与时尚服装互动来改善在线购物流程并提高用户参与度。该平台提供AR试穿解决方案,包括AR试衣镜等工具,顾客可以在实体店内、广告牌或店面橱窗前虚拟试穿服装。

SadTalker
SadTalker 是由西安交通大学(西交大)开源的项目。它是一个用于生成风格化的单图说话人脸动画的工具,可以根据输入的图片和音频生成对应音频口型的视频。用户可以给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴、眨眼、移动头部等。它可以从音频中生成3DMM的3D运动系数(头部姿势、表情),并隐式调制一种新颖的3D感知面部渲染,用于生成说话的头部运动视频。

美图数字人开放平台
美图数字人开放平台是美图公司旗下的一个专注于3D数字人制作、AI人像驱动、AIGC内容制作以及AI人机交互的服务平台。通过美图数字人开放平台,用户可以轻松创建具有高度个性化的数字人形象,并应用于各种场景和领域,如影视制作、虚拟客服、品牌代言等。该平台提供一系列的服务,旨在帮助客户打造品牌化的、独立的数字人IP,从而吸引更多的年轻客群。

Synthesia
Synthesia是一个基于人工智能的视频生成平台,它允许用户通过输入文本来创建逼真的虚拟人物视频。这个平台使用深度学习算法合成人脸表情和口型,使得虚拟人物能够根据用户提供的文字说话。

Hand Talk
Hand Talk是一款基于人工智能AI自动将文本和音频翻译成手语的应用程序。用户只需输入文本或说话,Hand Talk便能将其迅速转换成手语,支持英语到美国手语(ASL)和葡萄牙语到巴西手语(Libras)的翻译。

商汤如影
商汤如影(SenseAvatar)是商汤科技旗下的数字人视频生成平台。它基于AI数字人视频生成算法、语言大模型、AI文生图、AIGC等多种能力,致力于让每个人都可以轻松创作高质量、高效率的数字人视频内容。

Synthesia
Synthesia是一个基于人工智能的视频生成平台,它允许用户通过输入文本来创建逼真的虚拟人物视频。这个平台使用深度学习算法合成人脸表情和口型,使得虚拟人物能够根据用户提供的文字说话。

司马诸葛
司马诸葛是一个基于自研文档智能模型(DocMind)+大语言模型技术的企业级AI数字员工平台(AI Agent),帮助企业加速AI场景的落地。企业无需复杂设置,通过企业知识文档,就可训练专属AI数字员工,提供7*24小时在线服务,解决企业内外部的知识问答、专业文档分析、内容再创作等任务。适用于AI客服、AI人事、AI法务、AI销售顾问等多个场景,提升企业效率和客户体验。
暂无评论...