Fatos principais
- Categoria
- Media
- Tipos de entrada
- file, text
- Tipo de saída
- file
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O divisor de áudio por silêncio é uma ferramenta eficiente para segmentar automaticamente arquivos de áudio longos em partes menores, identificando pausas naturais com base em limites de volume e duração configuráveis.
Quando usar
- •Para separar gravações de entrevistas longas em blocos individuais de fala.
- •Para extrair frases ou palavras isoladas de arquivos de áudio contínuos.
- •Para remover longos períodos de silêncio de podcasts ou gravações de voz.
Como funciona
- •Envie o seu arquivo de áudio no formato suportado.
- •Defina o limite de silêncio em decibéis (dB) e a duração mínima da pausa em segundos.
- •O sistema processa o arquivo, detecta os pontos de silêncio e divide o áudio automaticamente.
- •Baixe os segmentos gerados prontos para uso.
Casos de uso
Exemplos
1. Segmentação de Entrevista
Editor de Podcast- Contexto
- O editor possui uma gravação de 1 hora com várias pausas longas entre as perguntas e respostas.
- Problema
- Remover manualmente cada pausa é demorado e ineficiente.
- Como usar
- Carregar o arquivo da entrevista e configurar o limite de silêncio para -35dB com duração de 1 segundo.
- Configuração de exemplo
-
silenceThreshold: -35dB, silenceDuration: 1.0 - Resultado
- O áudio é dividido automaticamente em vários clipes curtos, facilitando a edição e a montagem final.
2. Preparação de Dataset de Voz
Pesquisador de IA- Contexto
- O pesquisador precisa de centenas de amostras curtas de fala para treinar um modelo de reconhecimento de voz.
- Problema
- O arquivo original contém longos silêncios que precisam ser descartados para limpar o dataset.
- Como usar
- Upload do arquivo de áudio e ajuste dos parâmetros para detectar pausas curtas de 0.5 segundos.
- Configuração de exemplo
-
silenceThreshold: -40dB, silenceDuration: 0.5 - Resultado
- O arquivo é segmentado em frases individuais, eliminando o silêncio e otimizando o dataset para o treinamento.
Testar com amostras
audio, fileHubs relacionados
FAQ
Quais formatos de áudio são suportados?
A ferramenta suporta a maioria dos formatos de áudio padrão, como MP3, WAV e AAC.
Como ajusto a sensibilidade da detecção?
Você pode ajustar o limite de silêncio (em dB) e a duração mínima (em segundos) para tornar a detecção mais ou menos rigorosa.
Existe um limite de tamanho para o arquivo?
Sim, o limite máximo para upload é de 200 MB por arquivo.
A qualidade do áudio é alterada?
Não, a ferramenta realiza o corte sem recompressão, mantendo a qualidade original do arquivo.
Posso processar vários arquivos de uma vez?
Atualmente, a ferramenta processa um arquivo de áudio por vez.