非静音片段检测

关键信息

分类: 图像、音频与视频
输入类型: file, number
输出类型: json
样本覆盖: 4
支持 API: Yes

概览

非静音片段检测工具是一款高效的音频分析工具，能够自动识别并提取音频文件中包含声音的有效片段，帮助用户快速定位录音中的关键内容。

适用场景

•需要从长录音中快速提取所有说话片段时
•在进行音频剪辑前，需要定位有声区域以去除冗余静音时
•分析会议录音或播客，快速获取有效音频的时间戳信息时

工作原理

•上传您的音频文件，系统将自动加载并准备分析。
•根据录音环境设置静音阈值（dB）和最小静音时长，以优化检测精度。
•点击检测按钮，工具将分析音频波形并输出所有非静音片段的起始与结束时间。

使用场景

播客后期制作：快速定位嘉宾发言时间，跳过长时间的沉默。

会议纪要整理：提取会议录音中的有效对话，忽略无人发言的静默期。

语音识别预处理：通过提取非静音片段，减少无效音频对语音转文字准确率的影响。

用户案例

1. 会议录音片段定位

会议记录员

背景原因: 需要整理一份长达 2 小时的会议录音，其中包含大量无人发言的间隙。
解决问题: 手动查找发言时间点非常耗时，难以快速定位有效内容。
如何使用: 上传录音文件，设置静音阈值为 -45dB，最小静音时长为 1 秒。
示例配置: thresholdDb: -45, minSilence: 1.0
效果: 成功获取了所有发言片段的时间戳列表，大幅缩短了整理会议纪要的时间。

用 Samples 测试

audio, file

无版权AAC音频样本

用于测试与开发的高质量AAC编码音频样本集合，包含自然声音与冥想音乐

title token audio

audio

无版权FLAC音频样本

用于测试与开发的 FLAC 无损音频样本集合，包含自然声音与冥想音乐

title token audio

audio

无版权M4A音频样本

Apple iTunes兼容的M4A音频样本集合，经过优化实现质量与文件大小的平衡

title token audio

audio

无版权MP3音频样本

免费使用和测试的无版权音频样本集合，包括自然声音、冥想音乐和环境音频，适用于测试和开发目的

title token audio

audio

常见问题

该工具支持哪些音频格式？

支持常见的多种音频格式，只要文件大小在 200MB 以内即可上传。

静音阈值（dB）应该如何设置？

通常建议设置为 -50dB。如果背景噪音较大，可适当调高阈值；如果录音环境非常安静，可调低阈值。

最小静音时长有什么作用？

该参数用于过滤掉极短的停顿，防止将一句话中间的微小呼吸声误判为静音，从而将片段拆分得过于零碎。

检测结果包含哪些信息？

检测结果将以 JSON 格式返回，包含每个非静音片段的开始时间点和结束时间点。

处理后的音频会自动剪辑吗？

本工具仅负责检测并列出非静音片段的时间戳，不会直接对音频文件进行物理剪辑。

参数名	类型	必填	描述
audioFile	file (需要先上传)	是	-
thresholdDb	number	否	-
minSilence	number	否	-

关键信息

概览

适用场景

工作原理

使用场景

用户案例

1. 会议录音片段定位

用 Samples 测试

相关专题

常见问题

API 文档

请求端点

请求参数

响应格式

AI MCP 文档

非静音片段检测

关键信息

概览

适用场景

工作原理

使用场景

用户案例

1. 会议录音片段定位

用 Samples 测试

相关专题

相关工具

常见问题

API 文档

请求端点

请求参数

响应格式

AI MCP 文档