Kategorien

Text-Ähnlichkeits-Detektor

Berechnet die Ähnlichkeitsprozentzahl zwischen zwei Texten mit mehreren Algorithmen einschließlich Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit und Levenshtein-Distanz

Treat uppercase and lowercase as different characters

Remove extra spaces, tabs, and newlines before comparison

Ignore words shorter than this length

Wichtige Fakten

Kategorie
Text Processing
Eingabetypen
textarea, select, checkbox, number
Ausgabetyp
text
Sample-Abdeckung
4
API verfügbar
Yes

Überblick

Der Text-Ähnlichkeits-Detektor berechnet die prozentuale Übereinstimmung zwischen zwei Texten mithilfe von Algorithmen wie Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit und Levenshtein-Distanz. Er eignet sich für präzise Vergleiche und Analysen in verschiedenen Textverarbeitungsszenarien.

Wann verwenden

  • Wenn Sie zwei Texte auf inhaltliche Ähnlichkeit überprüfen müssen, z. B. bei Dokumentenvergleichen.
  • Bei der Erkennung von Plagiaten oder duplizierten Inhalten in akademischen oder professionellen Arbeiten.
  • Zur Analyse von Textvariationen, wie Übersetzungen oder Kundenfeedback, auf Gemeinsamkeiten.

So funktioniert es

  • Geben Sie die beiden zu vergleichenden Texte in die vorgesehenen Textfelder ein.
  • Wählen Sie einen Ähnlichkeitsalgorithmus aus: Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit, Levenshtein-Distanz oder die kombinierte Option.
  • Passen Sie optionale Einstellungen an, wie Groß-/Kleinschreibung, Leerzeichen ignorieren und minimale Wortlänge.
  • Das Tool berechnet die Ähnlichkeit und gibt das Ergebnis als Prozentzahl aus.

Anwendungsfälle

Überprüfung von wissenschaftlichen Arbeiten oder Artikeln auf Plagiate oder unzitierte Übernahmen.
Vergleich von Produktbeschreibungen oder Marketingtexten, um Duplikate in Datenbanken zu finden.
Analyse von Kundenrezensionen oder Feedback-Formularen, um ähnliche Muster oder Beschwerden zu erkennen.

Beispiele

1. Plagiatsprüfung in akademischen Arbeiten

Student
Hintergrund
Ein Student muss seine Masterarbeit auf mögliche Übereinstimmungen mit anderen Quellen überprüfen, um Plagiate zu vermeiden.
Problem
Manuelle Vergleiche sind zeitaufwendig und können Fehler übersehen.
Verwendung
Kopieren Sie den Text Ihrer Arbeit in das erste Feld und den Referenztext in das zweite Feld. Wählen Sie den kombinierten Algorithmus für eine umfassende Analyse.
Beispielkonfiguration
{"algorithm": "combined", "caseSensitive": false, "ignoreWhitespace": true, "minWordLength": 2}
Ergebnis
Das Tool gibt einen Ähnlichkeitsprozentsatz aus, der schnell potenzielle Plagiate anzeigt und zur Überarbeitung anleitet.

2. Duplikaterkennung in E-Commerce-Beschreibungen

Hintergrund
Ein Content-Manager eines Online-Shops bemerkt ähnliche Produktbeschreibungen im System, die SEO und Kundenerfahrung beeinträchtigen.
Problem
Duplikate können zu Verwirrung bei Kunden und schlechteren Suchmaschinen-Rankings führen.
Verwendung
Fügen Sie die beiden Produktbeschreibungen in die Textfelder ein. Verwenden Sie die Jaccard-Ähnlichkeit, um Wortmengen effizient zu vergleichen.
Beispielkonfiguration
{"algorithm": "jaccard", "ignoreWhitespace": true}
Ergebnis
Identifizierung ähnlicher Beschreibungen zur Bereinigung des Katalogs und Verbesserung der Website-Qualität.

Mit Samples testen

video, text

Verwandte Hubs

FAQ

Welche Algorithmen unterstützt das Tool?

Es unterstützt Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit, Levenshtein-Distanz und eine kombinierte Option für durchschnittliche Ergebnisse.

Kann ich die Groß-/Kleinschreibung ignorieren?

Ja, über die Option 'Groß-/Kleinschreibung' können Sie einstellen, ob Groß- und Kleinschreibung unterschieden werden soll.

Was bewirkt die Einstellung 'Leerzeichen Ignorieren'?

Sie entfernt zusätzliche Leerzeichen, Tabs und Zeilenumbrüche vor dem Vergleich, um präzisere Ergebnisse zu erzielen.

Wozu dient die minimale Wortlänge?

Diese Einstellung ignoriert Wörter, die kürzer als die angegebene Länge sind, um den Vergleich auf relevante Begriffe zu fokussieren.

Wie wird das Ergebnis dargestellt?

Das Ergebnis wird als Prozentzahl der Ähnlichkeit zwischen den beiden Texten angezeigt, basierend auf dem gewählten Algorithmus.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/text-similarity-detector

Request-Parameter

Parameter-Name Typ Erforderlich Beschreibung
text1 textarea Ja -
text2 textarea Ja -
algorithm select Ja -
caseSensitive checkbox Nein Treat uppercase and lowercase as different characters
ignoreWhitespace checkbox Nein Remove extra spaces, tabs, and newlines before comparison
minWordLength number Nein Ignore words shorter than this length

Antwortformat

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Text: Text

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-text-similarity-detector": {
      "name": "text-similarity-detector",
      "description": "Berechnet die Ähnlichkeitsprozentzahl zwischen zwei Texten mit mehreren Algorithmen einschließlich Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit und Levenshtein-Distanz",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-similarity-detector",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]