Kategorien

Text-Ähnlichkeits-Detektor

Berechnet die Ähnlichkeitsprozentzahl zwischen zwei Texten mit mehreren Algorithmen einschließlich Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit und Levenshtein-Distanz

Wichtige Fakten

Kategorie: Text Processing
Eingabetypen: textarea, select, checkbox, number
Ausgabetyp: text
Sample-Abdeckung: 4
API verfügbar: Yes

Überblick

Der Text-Ähnlichkeits-Detektor berechnet die prozentuale Übereinstimmung zwischen zwei Texten mithilfe von Algorithmen wie Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit und Levenshtein-Distanz. Er eignet sich für präzise Vergleiche und Analysen in verschiedenen Textverarbeitungsszenarien.

Wann verwenden

•Wenn Sie zwei Texte auf inhaltliche Ähnlichkeit überprüfen müssen, z. B. bei Dokumentenvergleichen.
•Bei der Erkennung von Plagiaten oder duplizierten Inhalten in akademischen oder professionellen Arbeiten.
•Zur Analyse von Textvariationen, wie Übersetzungen oder Kundenfeedback, auf Gemeinsamkeiten.

So funktioniert es

•Geben Sie die beiden zu vergleichenden Texte in die vorgesehenen Textfelder ein.
•Wählen Sie einen Ähnlichkeitsalgorithmus aus: Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit, Levenshtein-Distanz oder die kombinierte Option.
•Passen Sie optionale Einstellungen an, wie Groß-/Kleinschreibung, Leerzeichen ignorieren und minimale Wortlänge.
•Das Tool berechnet die Ähnlichkeit und gibt das Ergebnis als Prozentzahl aus.

Anwendungsfälle

Überprüfung von wissenschaftlichen Arbeiten oder Artikeln auf Plagiate oder unzitierte Übernahmen.

Vergleich von Produktbeschreibungen oder Marketingtexten, um Duplikate in Datenbanken zu finden.

Analyse von Kundenrezensionen oder Feedback-Formularen, um ähnliche Muster oder Beschwerden zu erkennen.

Beispiele

1. Plagiatsprüfung in akademischen Arbeiten

Student

Hintergrund: Ein Student muss seine Masterarbeit auf mögliche Übereinstimmungen mit anderen Quellen überprüfen, um Plagiate zu vermeiden.
Problem: Manuelle Vergleiche sind zeitaufwendig und können Fehler übersehen.
Verwendung: Kopieren Sie den Text Ihrer Arbeit in das erste Feld und den Referenztext in das zweite Feld. Wählen Sie den kombinierten Algorithmus für eine umfassende Analyse.
Beispielkonfiguration: {"algorithm": "combined", "caseSensitive": false, "ignoreWhitespace": true, "minWordLength": 2}
Ergebnis: Das Tool gibt einen Ähnlichkeitsprozentsatz aus, der schnell potenzielle Plagiate anzeigt und zur Überarbeitung anleitet.

2. Duplikaterkennung in E-Commerce-Beschreibungen

Hintergrund: Ein Content-Manager eines Online-Shops bemerkt ähnliche Produktbeschreibungen im System, die SEO und Kundenerfahrung beeinträchtigen.
Problem: Duplikate können zu Verwirrung bei Kunden und schlechteren Suchmaschinen-Rankings führen.
Verwendung: Fügen Sie die beiden Produktbeschreibungen in die Textfelder ein. Verwenden Sie die Jaccard-Ähnlichkeit, um Wortmengen effizient zu vergleichen.
Beispielkonfiguration: {"algorithm": "jaccard", "ignoreWhitespace": true}
Ergebnis: Identifizierung ähnlicher Beschreibungen zur Bereinigung des Katalogs und Verbesserung der Website-Qualität.

Mit Samples testen

video, text

Text-Beispiele mit Emojis

Mehrsprachiger Text mit verschiedenen Unicode-Emojis zum Testen der Emoji-Extraktion

title token text

video, text

Beispiele für Gemischten Chinesisch-Englischen Text

Beispieltextdateien mit gemischtem chinesisch-englischem Inhalt zum Testen von Tools für automatisches Spacing

title token text

text

Text mit Daten Mustern

Texte mit verschiedenen Datumsformaten zum Testen der Datumsextraktion und -analyse

title token text

text

Textbeispiele mit Sensiblen Daten

Text mit verschiedenen Arten sensibler Daten zum Testen der Datenmaskierung (Telefonnummern, E-Mails, Ausweise, Bankkarten)

title token text

text

FAQ

Welche Algorithmen unterstützt das Tool?

Es unterstützt Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit, Levenshtein-Distanz und eine kombinierte Option für durchschnittliche Ergebnisse.

Kann ich die Groß-/Kleinschreibung ignorieren?

Ja, über die Option 'Groß-/Kleinschreibung' können Sie einstellen, ob Groß- und Kleinschreibung unterschieden werden soll.

Was bewirkt die Einstellung 'Leerzeichen Ignorieren'?

Sie entfernt zusätzliche Leerzeichen, Tabs und Zeilenumbrüche vor dem Vergleich, um präzisere Ergebnisse zu erzielen.

Wozu dient die minimale Wortlänge?

Diese Einstellung ignoriert Wörter, die kürzer als die angegebene Länge sind, um den Vergleich auf relevante Begriffe zu fokussieren.

Wie wird das Ergebnis dargestellt?

Das Ergebnis wird als Prozentzahl der Ähnlichkeit zwischen den beiden Texten angezeigt, basierend auf dem gewählten Algorithmus.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/text-similarity-detector

Request-Parameter

Parameter-Name	Typ	Erforderlich	Beschreibung
text1	textarea	Ja	-
text2	textarea	Ja	-
algorithm	select	Ja	-
caseSensitive	checkbox	Nein	Treat uppercase and lowercase as different characters
ignoreWhitespace	checkbox	Nein	Remove extra spaces, tabs, and newlines before comparison
minWordLength	number	Nein	Ignore words shorter than this length

Antwortformat

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}

Text: Text

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-text-similarity-detector": {
      "name": "text-similarity-detector",
      "description": "Berechnet die Ähnlichkeitsprozentzahl zwischen zwei Texten mit mehreren Algorithmen einschließlich Kosinus-Ähnlichkeit, Jaccard-Ähnlichkeit und Levenshtein-Distanz",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=text-similarity-detector",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]

Kategorien

Text-Ähnlichkeits-Detektor

Wichtige Fakten

Überblick

Wann verwenden

So funktioniert es

Anwendungsfälle

Beispiele

1. Plagiatsprüfung in akademischen Arbeiten

2. Duplikaterkennung in E-Commerce-Beschreibungen

Mit Samples testen

Verwandte Hubs

Verwandte Tools

FAQ

API-Dokumentation

Request-Endpunkt

Request-Parameter

Antwortformat

MCP-Dokumentation