FunAudioLLMFunAudioLLM 是由阿里巴巴通义团队开发的旨在增强人类与大型语言模型(LLMs)之间的自然语音交互的框架。其核心包括两个创新模型:SenseVoice 和 CosyVoice。SenseVoice 提供高精度的多语言语音识别、情绪识别和音频事件检测,支持超过 50 种语言,并具有极低的延迟。CosyVoice 则专注于自然语音生成,支持多语言、音色和情绪控制,能够进行零样本语音生成、跨语言语音克隆和指令遵循。020AI大模型# ai音频生成模型# CosyVoice大模型# FunAudioLLM
HarmonaiHarmonai是一个开源生成音频工具,让音乐创作更有趣。您可以使用舞蹈扩散模型生成各种风格的音乐,或者使用Harmonai Studio在线制作自己的音乐作品。加入Harmonai,体验AI音乐的魅力。020AI大模型# ai音频模型# ai音频生成模型# Harmonai音频工具