CosyVoice-AI声音克隆离线整合包

3123123

介绍

该项目是由阿里开源的聚合多语言大语音生成模型，提供推理、训练和部署全栈能力，项目中FunAudioLLM为核心框架，其两个主要模型用于高精度多语言语音识别、情感识别和音频事件检测的 SenseVoice;以及 CosyVoice，用于通过多语言、音色和情感控制进行自然语音生成。SenseVoice 提供极低的延迟并支持 50 多种语言，而 CosyVoice 在多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟踪功能方面表现出色。与 SenseVoice 和 CosyVoice 相关的模型已在 Modelscope 和 Huggingface 上开源，以及 GitHub 上发布的相应训练、推理和微调代码。通过将这些模型与 LLM 集成，FunAudioLLM 实现了语音翻译、情感语音聊天、交互式播客和富有表现力的有声读物旁白等应用，从而突破了语音交互技术的界限

项目地址：https://github.com/FunAudioLLM/CosyVoice

CosyVoice整合包下载：https://pan.quark.cn/s/74ce36f251b6

引：整合包由up主十个骑士制作

1720958147048