关键信息
- 分类
- Media
- 输入类型
- file, select
- 输出类型
- file
- 样本覆盖
- 4
- 支持 API
- Yes
概览
人声/伴奏分离工具是一款基于 AI 技术的音频处理工具,支持使用 Spleeter 或 MDX/Demucs 引擎,快速将音频文件中的人声与伴奏进行精准拆分,并打包为压缩文件供您下载。
适用场景
- •需要制作卡拉 OK 伴奏或进行翻唱录制时。
- •需要提取音频中的人声素材进行混音或采样创作时。
- •需要分析歌曲编曲结构或进行音频后期处理时。
工作原理
- •上传您的音频文件,支持多种主流音频格式。
- •选择分离引擎(Spleeter 或 MDX/Demucs)并设置所需的输出格式。
- •点击处理按钮,系统将调用 AI 引擎进行音轨分离。
- •下载包含人声和伴奏轨道的 ZIP 压缩包。
使用场景
用户案例
1. 制作翻唱伴奏
音乐爱好者- 背景原因
- 用户想要翻唱一首流行歌曲,但找不到官方伴奏。
- 解决问题
- 需要从原曲中去除人声,保留纯净的伴奏轨道。
- 如何使用
- 上传原曲音频,选择 MDX 引擎以获得更高质量的分离效果,输出格式设为 WAV。
- 示例配置
-
engine: mdx, outputFormat: wav - 效果
- 获得了一个包含纯伴奏和纯人声的 ZIP 包,伴奏音质清晰,可直接用于录音。
2. 提取人声素材
视频剪辑师- 背景原因
- 剪辑师需要一段特定歌曲的人声片段作为视频旁白素材。
- 解决问题
- 原音频中伴奏音量过大,干扰了人声的清晰度。
- 如何使用
- 上传音频文件,使用 Spleeter 引擎快速分离,输出格式选择 MP3 以方便后续剪辑。
- 示例配置
-
engine: spleeter, outputFormat: mp3 - 效果
- 成功提取出干净的人声轨道,去除了背景音乐的干扰。
用 Samples 测试
markdown, audio, file相关专题
常见问题
支持哪些音频格式上传?
支持大多数常见的音频格式,如 MP3、WAV、FLAC 等。
Spleeter 和 MDX 引擎有什么区别?
两者均为先进的 AI 分离模型,MDX/Demucs 通常在复杂音频中表现出更高的分离精度。
处理后的文件是什么格式?
您可以根据需求选择 WAV、FLAC、MP3、M4A、OGG 或 Opus 格式。
文件大小有限制吗?
单次上传的音频文件大小限制为 200MB。
分离后的结果如何获取?
处理完成后,系统会自动生成一个包含人声和伴奏轨道的 ZIP 压缩包供您下载。