人声/伴奏分离

关键信息

分类: 图像、音频与视频
输入类型: file, select
输出类型: file
样本覆盖: 4
支持 API: Yes

概览

人声/伴奏分离工具是一款基于 AI 技术的音频处理工具，支持使用 Spleeter 或 MDX/Demucs 引擎，快速将音频文件中的人声与伴奏进行精准拆分，并打包为压缩文件供您下载。

适用场景

•需要制作卡拉 OK 伴奏或进行翻唱录制时。
•需要提取音频中的人声素材进行混音或采样创作时。
•需要分析歌曲编曲结构或进行音频后期处理时。

工作原理

•上传您的音频文件，支持多种主流音频格式。
•选择分离引擎（Spleeter 或 MDX/Demucs）并设置所需的输出格式。
•点击处理按钮，系统将调用 AI 引擎进行音轨分离。
•下载包含人声和伴奏轨道的 ZIP 压缩包。

使用场景

音乐制作人提取干声进行混音重制。

K 歌爱好者快速制作高质量伴奏。

音频剪辑师从复杂背景音中提取人声对白。

用户案例

1. 制作翻唱伴奏

音乐爱好者

背景原因: 用户想要翻唱一首流行歌曲，但找不到官方伴奏。
解决问题: 需要从原曲中去除人声，保留纯净的伴奏轨道。
如何使用: 上传原曲音频，选择 MDX 引擎以获得更高质量的分离效果，输出格式设为 WAV。
示例配置: engine: mdx, outputFormat: wav
效果: 获得了一个包含纯伴奏和纯人声的 ZIP 包，伴奏音质清晰，可直接用于录音。

2. 提取人声素材

视频剪辑师

背景原因: 剪辑师需要一段特定歌曲的人声片段作为视频旁白素材。
解决问题: 原音频中伴奏音量过大，干扰了人声的清晰度。
如何使用: 上传音频文件，使用 Spleeter 引擎快速分离，输出格式选择 MP3 以方便后续剪辑。
示例配置: engine: spleeter, outputFormat: mp3
效果: 成功提取出干净的人声轨道，去除了背景音乐的干扰。

用 Samples 测试

markdown, audio, file

无版权AAC音频样本

用于测试与开发的高质量AAC编码音频样本集合，包含自然声音与冥想音乐

title token audio

audio

无版权FLAC音频样本

用于测试与开发的 FLAC 无损音频样本集合，包含自然声音与冥想音乐

title token audio

audio

无版权M4A音频样本

Apple iTunes兼容的M4A音频样本集合，经过优化实现质量与文件大小的平衡

title token audio

audio

无版权MP3音频样本

免费使用和测试的无版权音频样本集合，包括自然声音、冥想音乐和环境音频，适用于测试和开发目的

title token audio

audio

常见问题

支持哪些音频格式上传？

支持大多数常见的音频格式，如 MP3、WAV、FLAC 等。

Spleeter 和 MDX 引擎有什么区别？

两者均为先进的 AI 分离模型，MDX/Demucs 通常在复杂音频中表现出更高的分离精度。

处理后的文件是什么格式？

您可以根据需求选择 WAV、FLAC、MP3、M4A、OGG 或 Opus 格式。

文件大小有限制吗？

单次上传的音频文件大小限制为 200MB。

分离后的结果如何获取？

处理完成后，系统会自动生成一个包含人声和伴奏轨道的 ZIP 压缩包供您下载。

参数名	类型	必填	描述
audioFile	file (需要先上传)	是	-
engine	select	否	-
outputFormat	select	否	-

关键信息

概览

适用场景

工作原理

使用场景

用户案例

1. 制作翻唱伴奏

2. 提取人声素材

用 Samples 测试

相关专题

常见问题

API 文档

请求端点

请求参数

响应格式

AI MCP 文档

人声/伴奏分离

关键信息

概览

适用场景

工作原理

使用场景

用户案例

1. 制作翻唱伴奏

2. 提取人声素材

用 Samples 测试

相关专题

相关工具

常见问题

API 文档

请求端点

请求参数

响应格式

AI MCP 文档