Tag: audio

All the articles with the tag "audio".

Spark-TTS：一个高效的基于LLM的文本转语音模型推理代码
Published:2025-03-26
Spark-TTS是一个高级文本转语音系统，利用大型语言模型（LLM）实现高质量和自然的语音合成。该项目提供推理代码，旨在高效、灵活，适合研究和生产使用。支持中英文零样本语音克隆，具有可控的语音生成能力，适用于多种应用场景。
Seed-VC: 实时支持的零样本语音转换与歌声转换工具
Published:2025-03-18
Seed-VC 是一个支持零样本语音转换、实时语音转换和零样本歌声转换的工具。通过仅需 1-30 秒的参考语音，Seed-VC 能够无训练地克隆语音。具备极快的训练速度并可在在线会议、游戏和直播中使用，迎合多种需求。
Netease云音乐无损解析工具 - 开源MIT授权
Published:2025-03-11
本项目提供网易云音乐的无损解析工具，支持API及GUI模式。用户可自由使用、修改和分享代码，但不得用于商业项目。请遵循MIT许可证。使用Python环境进行安装和运行，支持多种音质选择，包括无损音质和极高音质。
Sonic：聚焦全球音频感知的肖像动画官方实现
Published:2025-02-03
Sonic是一个专注于肖像动画中全球音频感知的工具。其官方实现可以在[GitHub](https://github.com/jixiaozhong/Sonic)找到，提供了多种功能，包括演示和模型下载。了解更多关于Sonic的最新动态和开发更新。
RylanBot Melody Workshop：直接在浏览器中进行音频处理和轨道混合的音频工具包
Published:2025-01-20
RylanBot的Melody Workshop是一个音频工具包，允许用户在浏览器中直接进行音频处理和轨道混合。它提供单音频处理、多个音轨混合和导出功能，方便音频创作和后期制作。

Tag: audio

Spark-TTS：一个高效的基于LLM的文本转语音模型推理代码

Seed-VC: 实时支持的零样本语音转换与歌声转换工具

Netease云音乐无损解析工具 - 开源MIT授权

Sonic：聚焦全球音频感知的肖像动画官方实现

RylanBot Melody Workshop：直接在浏览器中进行音频处理和轨道混合的音频工具包