关键信息
- 分类
- 图像、音频与视频
- 输入类型
- file, number
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
非静音片段检测工具是一款高效的音频分析工具,能够自动识别并提取音频文件中包含声音的有效片段,帮助用户快速定位录音中的关键内容。
适用场景
- •需要从长录音中快速提取所有说话片段时
- •在进行音频剪辑前,需要定位有声区域以去除冗余静音时
- •分析会议录音或播客,快速获取有效音频的时间戳信息时
工作原理
- •上传您的音频文件,系统将自动加载并准备分析。
- •根据录音环境设置静音阈值(dB)和最小静音时长,以优化检测精度。
- •点击检测按钮,工具将分析音频波形并输出所有非静音片段的起始与结束时间。
使用场景
用户案例
1. 会议录音片段定位
会议记录员- 背景原因
- 需要整理一份长达 2 小时的会议录音,其中包含大量无人发言的间隙。
- 解决问题
- 手动查找发言时间点非常耗时,难以快速定位有效内容。
- 如何使用
- 上传录音文件,设置静音阈值为 -45dB,最小静音时长为 1 秒。
- 示例配置
-
thresholdDb: -45, minSilence: 1.0 - 效果
- 成功获取了所有发言片段的时间戳列表,大幅缩短了整理会议纪要的时间。
用 Samples 测试
audio, file相关专题
常见问题
该工具支持哪些音频格式?
支持常见的多种音频格式,只要文件大小在 200MB 以内即可上传。
静音阈值(dB)应该如何设置?
通常建议设置为 -50dB。如果背景噪音较大,可适当调高阈值;如果录音环境非常安静,可调低阈值。
最小静音时长有什么作用?
该参数用于过滤掉极短的停顿,防止将一句话中间的微小呼吸声误判为静音,从而将片段拆分得过于零碎。
检测结果包含哪些信息?
检测结果将以 JSON 格式返回,包含每个非静音片段的开始时间点和结束时间点。
处理后的音频会自动剪辑吗?
本工具仅负责检测并列出非静音片段的时间戳,不会直接对音频文件进行物理剪辑。