Categorias

Detector de Similaridade de Texto

Calcula a porcentagem de similaridade entre dois textos usando múltiplos algoritmos incluindo Similaridade de Cosseno, Similaridade de Jaccard e Distância de Levenshtein

Treat uppercase and lowercase as different characters

Remove extra spaces, tabs, and newlines before comparison

Ignore words shorter than this length

Fatos principais

Categoria
Text Processing
Tipos de entrada
textarea, select, checkbox, number
Tipo de saída
text
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Detector de Similaridade de Texto é uma ferramenta precisa que calcula o nível de correspondência entre dois blocos de texto, utilizando algoritmos avançados como Similaridade de Cosseno, Jaccard e Distância de Levenshtein para fornecer resultados estatísticos confiáveis.

Quando usar

  • Para identificar duplicatas ou variações de conteúdo em grandes bases de dados.
  • Para comparar versões de documentos e verificar alterações significativas entre rascunhos.
  • Para analisar a consistência de estilo ou vocabulário entre diferentes autores ou artigos.

Como funciona

  • Insira os dois textos que deseja comparar nos campos designados.
  • Selecione o algoritmo de sua preferência (Cosseno, Jaccard, Levenshtein ou Combinado).
  • Ajuste as configurações opcionais, como sensibilidade a maiúsculas e ignorar espaços, para refinar a precisão.
  • Clique em processar para visualizar a porcentagem de similaridade calculada instantaneamente.

Casos de uso

Verificação de originalidade e detecção de plágio em textos acadêmicos ou artigos.
Limpeza de dados para remover entradas duplicadas em listas de clientes ou produtos.
Monitoramento de alterações em contratos ou documentos legais para identificar discrepâncias.

Exemplos

1. Comparação de Rascunhos de Artigos

Redator de Conteúdo
Contexto
O redator precisa garantir que duas versões de um artigo não sejam excessivamente parecidas para evitar problemas de SEO com conteúdo duplicado.
Problema
Identificar se a reescrita foi profunda o suficiente ou se ainda há muitas frases idênticas.
Como usar
Cole o texto original no campo 1 e a nova versão no campo 2, selecionando o algoritmo 'Combinado'.
Resultado
A ferramenta retorna uma porcentagem de similaridade, permitindo ao redator ajustar trechos específicos caso a similaridade esteja acima do limite aceitável.

2. Limpeza de Base de Dados de Produtos

Analista de E-commerce
Contexto
O analista possui uma lista de nomes de produtos com pequenas variações de digitação que precisam ser unificados.
Problema
Detectar quais descrições de produtos são essencialmente as mesmas, apesar de erros de digitação ou espaços extras.
Como usar
Utilize o algoritmo 'Levenshtein' com a opção 'Ignorar Espaços em Branco' ativada para comparar as descrições.
Resultado
A ferramenta destaca a proximidade entre os textos, facilitando a identificação de itens duplicados para exclusão ou fusão.

Testar com amostras

video, text

Hubs relacionados

FAQ

Qual algoritmo devo escolher?

Use o 'Combinado' para uma média geral, 'Cosseno' para análise vetorial, 'Jaccard' para conjuntos de palavras e 'Levenshtein' para edições caractere por caractere.

A ferramenta diferencia letras maiúsculas de minúsculas?

Sim, você pode ativar a opção 'Sensível a Maiúsculas' para tratar 'Texto' e 'texto' como diferentes.

O que faz a opção 'Ignorar Espaços em Branco'?

Ela remove espaços extras, tabulações e quebras de linha, garantindo que a comparação foque apenas no conteúdo textual.

O que é o 'Comprimento Mínimo de Palavra'?

É um filtro que ignora palavras curtas (como artigos ou preposições) para focar a análise em termos mais significativos.

Posso comparar textos muito longos?

Sim, a ferramenta processa textos extensos, embora o tempo de resposta possa variar dependendo do tamanho do conteúdo e do algoritmo escolhido.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/text-similarity-detector

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
text1 textarea Sim -
text2 textarea Sim -
algorithm select Sim -
caseSensitive checkbox Não Treat uppercase and lowercase as different characters
ignoreWhitespace checkbox Não Remove extra spaces, tabs, and newlines before comparison
minWordLength number Não Ignore words shorter than this length

Formato de resposta

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Texto: Texto

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-text-similarity-detector": {
      "name": "text-similarity-detector",
      "description": "Calcula a porcentagem de similaridade entre dois textos usando múltiplos algoritmos incluindo Similaridade de Cosseno, Similaridade de Jaccard e Distância de Levenshtein",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-similarity-detector",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]