Категории

Детектор звучащих участков

Определяет и перечисляет участки, где есть звук

Click to upload file or drag and drop file here

Maximum file size: 200MB Supported formats: audio/*

Ключевые факты

Категория
Media
Типы входных данных
file, number
Тип результата
json
Покрытие примерами
4
API доступен
Yes

Обзор

Детектор звучащих участков — это инструмент для автоматического анализа аудиофайлов, который точно определяет временные интервалы, содержащие полезный звуковой сигнал, отсекая тишину.

Когда использовать

  • Для быстрой нарезки длинных записей на активные фрагменты.
  • Для удаления пауз из подкастов, интервью или голосовых заметок.
  • Для анализа структуры аудиофайла и поиска моментов начала речи.

Как это работает

  • Загрузите аудиофайл в формате MP3, WAV или другом поддерживаемом аудиоформате.
  • Установите порог чувствительности в децибелах, чтобы определить, какой уровень громкости считать звуком.
  • Настройте минимальную длительность тишины, чтобы исключить короткие паузы между словами.
  • Получите список временных меток с началом и концом каждого звучащего фрагмента.

Сценарии использования

Автоматическая подготовка аудио для монтажа видео.
Очистка записей лекций от длительных пауз.
Подготовка данных для обучения систем распознавания речи.

Примеры

1. Очистка записи интервью

Подкастер
Контекст
Запись интервью длится час, но содержит много пауз, пока гость обдумывает ответы.
Проблема
Необходимо быстро найти все активные фрагменты речи для последующего монтажа.
Как использовать
Загрузить файл интервью и установить порог тишины на -45 дБ, чтобы отсечь фоновый шум.
Пример конфигурации
thresholdDb: -45, minSilence: 1.0
Результат
Получен список временных меток всех реплик, что позволило сократить время монтажа вдвое.

2. Анализ голосовых заметок

Студент
Контекст
Студент записывает лекции, но в них много длинных пауз, когда преподаватель пишет на доске.
Проблема
Нужно выделить только те части, где преподаватель говорит, чтобы сэкономить время при прослушивании.
Как использовать
Загрузить аудиофайл лекции и настроить детектор на игнорирование пауз короче 2 секунд.
Пример конфигурации
thresholdDb: -50, minSilence: 2.0
Результат
Система выдала список сегментов, содержащих только речь, исключив все длительные паузы.

Проверить на примерах

audio, file

Связанные хабы

FAQ

Какие форматы аудио поддерживаются?

Инструмент поддерживает большинство стандартных аудиоформатов, включая MP3, WAV, AAC и другие.

Что такое порог тишины в дБ?

Это уровень громкости, ниже которого звук считается тишиной. Значение -50 дБ является стандартным для большинства записей.

Можно ли настроить чувствительность детектора?

Да, вы можете регулировать порог тишины от -100 до -5 дБ в зависимости от фонового шума в вашей записи.

Как инструмент обрабатывает короткие паузы?

Параметр минимальной длительности тишины позволяет игнорировать короткие паузы, чтобы не разбивать речь на слишком мелкие части.

В каком виде я получу результат?

Результат предоставляется в формате JSON, содержащем список временных интервалов (начало и конец) для каждого найденного звукового сегмента.

Документация API

Конечная точка запроса

POST /ru/api/tools/audio-non-silence-detector

Параметры запроса

Имя параметра Тип Обязательно Описание
audioFile file (Требуется загрузка) Да -
thresholdDb number Нет -
minSilence number Нет -

Параметры типа файл должны быть загружены сначала через POST /upload/audio-non-silence-detector для получения filePath, затем filePath должен быть передан в соответствующее поле файла.

Формат ответа

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Данные JSON: Данные JSON

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-audio-non-silence-detector": {
      "name": "audio-non-silence-detector",
      "description": "Определяет и перечисляет участки, где есть звук",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=audio-non-silence-detector",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Поддерживает ссылки на файлы URL или кодирование Base64 для параметров файла.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]