AI Token Schaetzer

Analysiert gemischte Sprachen und schaetzt Tokens fuer OpenAI, Codex, Claude und DeepSeek

Schaetzt den Token-Verbrauch fuer eingefuegten Text oder hochgeladene TXT/Markdown-Dateien.

Funktionen:

  • Erkennt gemischte Sprach- und Schriftsysteme wie chinesische Han-Zeichen, lateinische Schrift, Kana, Hangul, Kyrillisch, Arabisch, Emojis, Symbole und code-aehnliche Zeilen
  • Zaehlt OpenAI / Codex o200kbase und OpenAI cl100kbase mit einem Offline-Tokenizer
  • Zaehlt Claude mit Anthropic counttokens, wenn CLAUDEAPIKEY oder ANTHROPICAPI_KEY verfuegbar ist, und faellt nur bei Fehlern auf Heuristik zurueck
  • Schaetzt DeepSeek mit transparenten Heuristiken, wenn kein offizieller Zaehler verfuegbar ist
  • Kennzeichnet jedes Profil als exact-offline-tokenizer, official-provider-api oder heuristic, damit Schaetzungen nicht als exakte Werte erscheinen

Beispielergebnisse

1 Beispiele

Gemischten chinesisch-englischen Prompt schaetzen

Analysiert eine kurze mehrsprachige Anweisung vor dem Senden an mehrere AI-Modelle

{
  "result": {
    "input": {
      "characters": 37
    },
    "language": {
      "primary": "Latin",
      "mixed": true
    },
    "estimates": [
      {
        "profile": "openai-codex-o200k-base"
      }
    ]
  }
}
Eingabeparameter anzeigen
{ "inputText": "请总结 this API design and list 3 risks.", "modelProfile": "All Profiles", "countMode": "raw-text" }

Click to upload file or drag and drop file here

Maximum file size: 20MB Supported formats: text/plain, text/markdown, .txt, .md, .csv, .json, .log

Wichtige Fakten

Kategorie
AI
Eingabetypen
textarea, file, select
Ausgabetyp
json
Sample-Abdeckung
4
API verfügbar
Yes

Überblick

Der AI Token Schätzer analysiert Ihren Text oder Ihre hochgeladenen Dokumente auf gemischte Sprachen, Codezeilen sowie Sonderzeichen und liefert präzise Token-Schätzungen für OpenAI, Codex, Claude und DeepSeek. Durch die Kombination aus exakten Offline-Tokenizern, offiziellen API-Abfragen und transparenten Heuristiken behalten Sie die volle Kontrolle über Ihre API-Kosten und Prompt-Längen.

Wann verwenden

  • Vor dem Absenden großer Prompts an LLMs, um unerwartete API-Kosten durch hohe Token-Zahlen zu vermeiden.
  • Bei der Arbeit mit mehrsprachigen Texten oder Code-Snippets, die je nach Tokenizer stark variierende Token-Mengen erzeugen.
  • Zur Optimierung von System-Prompts und Chat-Verläufen innerhalb der maximalen Kontextfenster von OpenAI, Claude und DeepSeek.

So funktioniert es

  • Fügen Sie Ihren Text direkt in das Eingabefeld ein oder laden Sie eine Textdatei wie TXT, Markdown oder JSON hoch.
  • Wählen Sie das gewünschte Modellprofil (z. B. OpenAI o200k_base, cl100k_base, Claude oder DeepSeek) und den Zählmodus aus.
  • Das Tool analysiert die Sprachzusammensetzung und berechnet die exakten oder geschätzten Token-Werte basierend auf Offline-Tokenizern oder Heuristiken.
  • Sie erhalten eine detaillierte Aufschlüsselung der Token-Zahlen inklusive einer transparenten Kennzeichnung der Berechnungsmethode.

Anwendungsfälle

Budgetplanung für Entwickler, die große Mengen an Dokumenten über LLM-APIs verarbeiten müssen.
Optimierung von mehrsprachigen Übersetzungs-Prompts durch Analyse der Token-Effizienz verschiedener Schriftsysteme.
Vorbereitung von strukturierten JSON- oder CSV-Datensätzen für das Fine-Tuning von Modellen.

Beispiele

1. Kostenkontrolle für mehrsprachige Prompts

KI-Entwickler
Hintergrund
Ein Entwickler baut eine Übersetzungs-App, die deutsche, chinesische und englische Texte verarbeitet, und möchte die API-Kosten vorab kalkulieren.
Problem
Mehrsprachige Texte verbrauchen je nach Tokenizer-Modell extrem unterschiedliche Mengen an Tokens.
Verwendung
Fügen Sie den gemischten Prompt in das Textfeld ein, wählen Sie 'Alle Profile' und klicken Sie auf Schätzen.
Beispielkonfiguration
inputText: 'Bitte übersetze: This is a test. 请确认收到。', modelProfile: 'All Profiles', countMode: 'raw-text'
Ergebnis
Das Tool zeigt sofort, dass der o200k_base Tokenizer für den chinesischen Teil deutlich effizienter ist als ältere Profile, was eine präzise Budgetierung ermöglicht.

2. Analyse von Markdown-Dokumentationen

Technischer Redakteur
Hintergrund
Ein Redakteur möchte eine umfangreiche Softwaredokumentation im Markdown-Format an Claude übergeben, um eine Zusammenfassung zu generieren.
Problem
Die Datei könnte das Kontextfenster überschreiten oder unerwartet teuer werden.
Verwendung
Laden Sie die .md-Datei hoch und wählen Sie das Profil 'Claude Sonnet Schätzung'.
Beispielkonfiguration
textFile: 'doku.md', modelProfile: 'Claude Sonnet Estimate', countMode: 'raw-text'
Ergebnis
Sie erhalten eine verlässliche Schätzung der benötigten Tokens für Claude, basierend auf der Struktur des Dokuments.

Mit Samples testen

json, csv, markdown

Verwandte Hubs

FAQ

Wie präzise sind die berechneten Token-Zahlen?

Für OpenAI (o200k_base und cl100k_base) nutzen wir exakte Offline-Tokenizer. Für Claude und DeepSeek kommen offizielle APIs oder transparente Heuristiken zum Einsatz, die entsprechend gekennzeichnet sind.

Unterstützt das Tool auch Programmiercode und Emojis?

Ja, der Schätzer erkennt Codezeilen, Emojis, mathematische Symbole sowie gemischte Schriftsysteme wie Chinesisch, Kyrillisch und Arabisch zuverlässig.

Welche Dateiformate kann ich hochladen?

Sie können Textdateien in den Formaten .txt, .md, .csv, .json und .log mit einer Größe von bis zu 20 MB hochladen.

Was ist der Unterschied zwischen 'Rohtext' und 'Chatnachricht'?

Der Rohtext-Modus zählt die reinen Zeichen, während der Chatnachricht-Modus die typische Strukturierung und Metadaten von Chat-Prompts in die Schätzung einbezieht.

Werden meine eingegebenen Daten oder API-Schlüssel gespeichert?

Nein, Ihre Daten werden lokal verarbeitet. Optionale API-Schlüssel für offizielle Abfragen werden nur temporär für die Anfrage genutzt und nicht dauerhaft gespeichert.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/ai-token-estimator

Request-Parameter

Parameter-Name Typ Erforderlich Beschreibung
inputText textarea Nein -
textFile file (Upload erforderlich) Nein -
modelProfile select Nein -
countMode select Nein -

Dateitypparameter müssen erst über POST /upload/ai-token-estimator hochgeladen werden, um filePath zu erhalten, dann filePath an das entsprechende Dateifeld übergeben.

Antwortformat

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
JSON-Daten: JSON-Daten

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-ai-token-estimator": {
      "name": "ai-token-estimator",
      "description": "Analysiert gemischte Sprachen und schaetzt Tokens fuer OpenAI, Codex, Claude und DeepSeek",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=ai-token-estimator",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Unterstützt URL-Dateilinks oder Base64-Codierung für Dateiparameter.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]