Fatos principais
- Categoria
- Imagens, áudio e vídeo
- Tipos de entrada
- file, number
- Tipo de saída
- json
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Detector de partes com som é uma ferramenta precisa para identificar automaticamente trechos de áudio que contêm conteúdo sonoro, permitindo localizar rapidamente falas, músicas ou efeitos em arquivos longos.
Quando usar
- •Para localizar rapidamente momentos de fala em gravações de entrevistas longas.
- •Para identificar trechos ativos em arquivos de áudio que contêm longos períodos de silêncio.
- •Para preparar segmentos de áudio para edição, filtrando apenas as partes com conteúdo relevante.
Como funciona
- •Envie o seu arquivo de áudio para a plataforma.
- •Ajuste o limite de decibéis (dB) para definir o que o sistema deve considerar como som.
- •Defina a duração mínima de silêncio para refinar a precisão da detecção.
- •O sistema processa o arquivo e retorna uma lista com os tempos de início e fim de cada trecho sonoro.
Casos de uso
Exemplos
1. Extração de falas em entrevistas
Jornalista- Contexto
- Uma entrevista de 2 horas com muitos momentos de silêncio e pausas para reflexão.
- Problema
- Localizar manualmente os trechos onde o entrevistado realmente fala.
- Como usar
- Carregar o arquivo da entrevista e ajustar o limite de silêncio para -45dB.
- Configuração de exemplo
-
thresholdDb: -45, minSilence: 1.0 - Resultado
- Uma lista precisa com os timestamps de cada resposta, economizando horas de audição.
2. Processamento de gravações de campo
Pesquisador de áudio- Contexto
- Gravações ambientais noturnas com longos períodos de inatividade.
- Problema
- Identificar apenas os momentos em que sons da natureza ocorrem.
- Como usar
- Configurar o limite de silêncio para -55dB para captar sons sutis.
- Configuração de exemplo
-
thresholdDb: -55, minSilence: 0.5 - Resultado
- Identificação automática de todos os eventos sonoros, descartando o silêncio absoluto.
Testar com amostras
audio, fileHubs relacionados
FAQ
Quais formatos de áudio são suportados?
A ferramenta suporta a maioria dos formatos de áudio padrão, como MP3, WAV, AAC e OGG.
Como o limite de silêncio (dB) afeta o resultado?
Um valor mais baixo (ex: -60dB) é mais sensível a sons baixos, enquanto um valor mais alto (ex: -20dB) ignora ruídos de fundo e foca apenas em sons intensos.
Existe um limite de tamanho para o arquivo?
Sim, o limite máximo para upload é de 200 MB por arquivo.
O que acontece se o áudio não tiver silêncio?
O sistema identificará o arquivo inteiro como um único segmento contínuo de som.
Posso exportar os resultados?
Sim, os resultados são fornecidos em formato JSON, facilitando a integração com outros softwares de edição.