Categorias

Dividir áudio por silêncio

Divide o áudio com base na detecção de silêncio

Click to upload file or drag and drop file here

Maximum file size: 200MB Supported formats: audio/*

Fatos principais

Categoria
Media
Tipos de entrada
file, text
Tipo de saída
file
Cobertura de amostras
4
API disponível
Yes

Visão geral

O divisor de áudio por silêncio é uma ferramenta eficiente para segmentar automaticamente arquivos de áudio longos em partes menores, identificando pausas naturais com base em limites de volume e duração configuráveis.

Quando usar

  • Para separar gravações de entrevistas longas em blocos individuais de fala.
  • Para extrair frases ou palavras isoladas de arquivos de áudio contínuos.
  • Para remover longos períodos de silêncio de podcasts ou gravações de voz.

Como funciona

  • Envie o seu arquivo de áudio no formato suportado.
  • Defina o limite de silêncio em decibéis (dB) e a duração mínima da pausa em segundos.
  • O sistema processa o arquivo, detecta os pontos de silêncio e divide o áudio automaticamente.
  • Baixe os segmentos gerados prontos para uso.

Casos de uso

Edição rápida de podcasts para remover pausas excessivas entre tópicos.
Preparação de datasets de voz para treinamento de modelos de IA.
Organização de gravações de reuniões longas em segmentos temáticos.

Exemplos

1. Segmentação de Entrevista

Editor de Podcast
Contexto
O editor possui uma gravação de 1 hora com várias pausas longas entre as perguntas e respostas.
Problema
Remover manualmente cada pausa é demorado e ineficiente.
Como usar
Carregar o arquivo da entrevista e configurar o limite de silêncio para -35dB com duração de 1 segundo.
Configuração de exemplo
silenceThreshold: -35dB, silenceDuration: 1.0
Resultado
O áudio é dividido automaticamente em vários clipes curtos, facilitando a edição e a montagem final.

2. Preparação de Dataset de Voz

Pesquisador de IA
Contexto
O pesquisador precisa de centenas de amostras curtas de fala para treinar um modelo de reconhecimento de voz.
Problema
O arquivo original contém longos silêncios que precisam ser descartados para limpar o dataset.
Como usar
Upload do arquivo de áudio e ajuste dos parâmetros para detectar pausas curtas de 0.5 segundos.
Configuração de exemplo
silenceThreshold: -40dB, silenceDuration: 0.5
Resultado
O arquivo é segmentado em frases individuais, eliminando o silêncio e otimizando o dataset para o treinamento.

Testar com amostras

audio, file

Hubs relacionados

FAQ

Quais formatos de áudio são suportados?

A ferramenta suporta a maioria dos formatos de áudio padrão, como MP3, WAV e AAC.

Como ajusto a sensibilidade da detecção?

Você pode ajustar o limite de silêncio (em dB) e a duração mínima (em segundos) para tornar a detecção mais ou menos rigorosa.

Existe um limite de tamanho para o arquivo?

Sim, o limite máximo para upload é de 200 MB por arquivo.

A qualidade do áudio é alterada?

Não, a ferramenta realiza o corte sem recompressão, mantendo a qualidade original do arquivo.

Posso processar vários arquivos de uma vez?

Atualmente, a ferramenta processa um arquivo de áudio por vez.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/audio-split-by-silence

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
audioFile file (Upload necessário) Sim -
silenceThreshold text Não -
silenceDuration text Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/audio-split-by-silence para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Arquivo: Arquivo

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-audio-split-by-silence": {
      "name": "audio-split-by-silence",
      "description": "Divide o áudio com base na detecção de silêncio",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=audio-split-by-silence",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]