Categorías

Detector de Similitud de Texto

Calcula el porcentaje de similitud entre dos textos usando múltiples algoritmos incluyendo Similitud de Coseno, Similitud de Jaccard y Distancia de Levenshtein

Treat uppercase and lowercase as different characters

Remove extra spaces, tabs, and newlines before comparison

Ignore words shorter than this length

Datos clave

Categoría
Text Processing
Tipos de entrada
textarea, select, checkbox, number
Tipo de salida
text
Cobertura de muestras
4
API disponible
Yes

Resumen

El Detector de Similitud de Texto es una herramienta avanzada diseñada para cuantificar con precisión el grado de coincidencia entre dos fragmentos de texto, utilizando algoritmos matemáticos y lingüísticos como la Similitud de Coseno, Jaccard y la Distancia de Levenshtein.

Cuándo usarlo

  • Para identificar duplicados o contenido plagiado en documentos académicos o artículos.
  • Para comparar versiones de un mismo texto y detectar cambios realizados durante una edición.
  • Para analizar la consistencia de estilo o vocabulario entre diferentes fuentes de información.

Cómo funciona

  • Introduce los dos textos que deseas comparar en los campos correspondientes.
  • Selecciona el algoritmo de comparación preferido (Coseno, Jaccard, Levenshtein o Combinado).
  • Ajusta las configuraciones opcionales, como la sensibilidad a mayúsculas o la eliminación de espacios, para refinar los resultados.
  • Haz clic en procesar para obtener el porcentaje exacto de similitud entre ambos textos.

Casos de uso

Verificación de originalidad en redacción de contenidos y blogs.
Comparación de contratos legales para identificar cláusulas modificadas.
Análisis de datos para limpiar bases de datos eliminando entradas duplicadas.

Ejemplos

1. Verificación de originalidad de artículos

Editor de contenidos
Contexto
Un redactor entregó un artículo y el editor sospecha que partes del texto fueron copiadas de una fuente externa.
Problema
Detectar si el texto enviado es original o si contiene fragmentos plagiados de un documento de referencia.
Cómo usarlo
Pega el artículo en 'Primer Texto' y la fuente sospechosa en 'Segundo Texto', seleccionando el algoritmo 'Jaccard'.
Configuración de ejemplo
Algoritmo: Jaccard, Ignorar espacios: activado.
Resultado
La herramienta devuelve un porcentaje de similitud que permite al editor decidir si el contenido requiere una reescritura.

2. Comparación de versiones de contratos

Asistente legal
Contexto
Se han realizado múltiples cambios en un contrato de servicios y es difícil rastrear qué cláusulas fueron alteradas.
Problema
Identificar rápidamente las diferencias estructurales entre la versión original y la versión revisada.
Cómo usarlo
Carga ambas versiones del contrato y utiliza el algoritmo de 'Distancia de Levenshtein'.
Configuración de ejemplo
Algoritmo: Levenshtein, Sensible a mayúsculas: activado.
Resultado
El resultado muestra la distancia de edición, ayudando a localizar exactamente dónde se realizaron los cambios en el texto.

Probar con muestras

video, text

Hubs relacionados

Preguntas frecuentes

¿Qué algoritmo es mejor para textos largos?

La Similitud de Coseno es generalmente más efectiva para textos largos, ya que analiza la frecuencia de las palabras en lugar de la estructura exacta.

¿Qué mide la Distancia de Levenshtein?

Mide el número mínimo de ediciones (inserciones, eliminaciones o sustituciones) necesarias para transformar un texto en otro.

¿Puedo ignorar palabras cortas en el análisis?

Sí, puedes configurar la 'Longitud Mínima de Palabra' para excluir términos irrelevantes y centrarte en el contenido significativo.

¿El análisis distingue entre mayúsculas y minúsculas?

Por defecto no, pero puedes activar la opción 'Sensible a Mayúsculas' si necesitas una comparación estricta.

¿Qué significa el modo 'Combinado'?

El modo combinado calcula el promedio de los resultados obtenidos por todos los algoritmos disponibles para ofrecer una métrica más equilibrada.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/text-similarity-detector

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
text1 textarea -
text2 textarea -
algorithm select -
caseSensitive checkbox No Treat uppercase and lowercase as different characters
ignoreWhitespace checkbox No Remove extra spaces, tabs, and newlines before comparison
minWordLength number No Ignore words shorter than this length

Formato de respuesta

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Texto: Texto

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-text-similarity-detector": {
      "name": "text-similarity-detector",
      "description": "Calcula el porcentaje de similitud entre dos textos usando múltiples algoritmos incluyendo Similitud de Coseno, Similitud de Jaccard y Distancia de Levenshtein",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-similarity-detector",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]