Token-Zähler
Schätzen Sie die Token-Anzahl in KI-Modellen mit Preisen für wichtige LLM
Statistiken
Geschätzte Kosten
$2.50 pro 1M Eingabe-Tokens
$10.00 pro 1M Ausgabe-Tokens
Was ist ein Token?
Der Token-Zähler schätzt, wie ein Text von KI-Modellen in Verarbeitungseinheiten aufgeteilt wird. Ein Token ist nicht einfach ein Wort oder Zeichen: Es kann ein ganzes Wort, ein Wortteil, ein Satzzeichen oder bei manchen Sprachen auch ein einzelnes Zeichen sein. Die Zählung ist wichtig für Kontextfenster, Kostenabschätzung, Prompt-Design, RAG-Snippets, Chatverläufe und die Frage, ob eine Eingabe noch in ein Modell passt. Unterschiedliche Modellfamilien verwenden unterschiedliche Tokenizer, daher ist das Ergebnis immer modellabhängig. Das Werkzeug hilft, Texte vor dem Senden zu kürzen, aufzuteilen oder gezielt zu strukturieren, ersetzt aber keine finale Prüfung im tatsächlichen API-Modell.
Anleitung
Grundlegende Bedienung
- Text im Eingabebereich eingeben oder einfügen.
- Das Ziel-KI-Modell wählen (GPT-4, Claude, Gemini usw.).
- Die geschätzte Token-Anzahl im rechten Bereich ansehen.
- Die geschätzte Ausgabelänge festlegen, um die API-Kosten zu berechnen.
Tokenisierungsregeln
- GPT-Serie: ~4 englische Zeichen = 1 Token, ~1,5 chinesische Zeichen = 1 Token
- Claude-Serie: Ähnlich wie GPT mit leichten Unterschieden
- DeepSeek-Serie: Auf Chinesisch optimiert, ~2 Zeichen = 1 Token
- Sonderzeichen, Satzzeichen und Zeilenumbrüche verbrauchen ebenfalls Tokens
- Strukturierter Text wie Code und JSON hat typischerweise eine höhere Token-Dichte
Anwendungsfälle
Technisches Prinzip
Moderne LLM-Tokenisierer verwenden Subword-Algorithmen — hauptsächlich Byte Pair Encoding (BPE) und SentencePiece — statt einer Trennung an Leerzeichen. BPE startet von einzelnen Bytes und führt iterativ die häufigsten benachbarten Paare zusammen, wodurch ein fester Wortschatz von typischerweise 32k–200k Symbolen entsteht. Häufige Wörter werden zu einzelnen Tokens, seltene Wörter zerfallen in mehrere Subwords, und beliebige Bytes (Emoji, Steuerzeichen) werden dennoch sicher kodiert, da das Alphabet alle 256 Bytes abdeckt. SentencePiece (verwendet von Llama, Mistral, Gemini-Varianten) behandelt Leerzeichen als reguläres Zeichen über den ▁-Marker, sodass führende Leerzeichen zum Teil des nächsten Tokens werden — daher sind ` hello` und `hello` in der Regel unterschiedliche Token-IDs. OpenAI veröffentlicht drei Haupt-BPE-Wortschatze über die tiktoken-Bibliothek: p50k_base (50.281 Tokens, GPT-3 / Codex), cl100k_base (100.277 Tokens, GPT-3.5 Turbo und GPT-4) sowie o200k_base (~200k Tokens, GPT-4o und o1), der die Nicht-Englisch-Abdeckung erweitert und die Token-Anzahl für Chinesisch/Japanisch um etwa das 1,4- bis 1,7-fache reduziert. Claude verwendet einen verwandten, proprietären Tokenisierer mit ähnlicher Wortschatzgröße. Als grobe Richtwerte gilt: Englischer Text durchschnittlich ~4 Zeichen pro Token, Chinesisch ~1,5–2 Zeichen pro Token bei cl100k_base und ~2 bei o200k_base, und ein einzelnes Emoji verbraucht oft 2–5 Tokens, da es als mehrere UTF-8-Bytes kodiert wird. Die Token-Anzahl bestimmt sowohl die Nutzung des Kontextfensters als auch die Kosten. Aktuelle Fenster umfassen GPT-4o 128k, Claude 3.5 Sonnet 200k und Gemini 1.5 Pro 2M; die Abrechnung erfolgt als tokens × Preis pro 1M, wobei Eingabe und Ausgabe separat bepreist werden (z. B. GPT-4o mit 2,50 $/10,00 $ pro 1M, Claude 3.5 Sonnet mit 3,00 $/15,00 $). Dieser Zähler verwendet heuristische Koeffizienten pro Familie, da die Auslieferung jedes Tokenisierer-Wortschatzes Megabytes an Daten bedeuten würde — das Ergebnis ist daher eine Arbeitsschätzung. Die verbindliche Zahl steht im usage-Feld der API-Antwort des Modells.
- BPE führt häufige Byte-Paare zu einem festen Wortschatz zusammen; OpenAI-Wortschatze sind cl100k_base (GPT-4/3.5), o200k_base (GPT-4o/o1), p50k_base (Codex).
- SentencePiece kodiert führende Leerzeichen als ▁, sodass ` world` und `world` in Llama/Mistral/Gemini unterschiedliche Token-IDs ergeben.
- Englisch-Heuristik ca. 4 Zeichen/Token; CJK ca. 1,5–2 Zeichen/Token bei cl100k_base, ca. 2 bei o200k_base; Emoji typischerweise 2–5 Tokens pro Zeichen.
- Kostenformel: (Eingabe-Tokens / 1.000.000) × Eingabe-Preis + (Ausgabe-Tokens / 1.000.000) × Ausgabe-Preis, wobei Eingabe und Ausgabe separat bepreist werden.
- Kontextfenster 2025: GPT-4o 128k, GPT-4 Turbo 128k, Claude 3.5 Sonnet 200k, Gemini 1.5 Pro 2M, DeepSeek V3 128k.
- Derselbe Text ergibt bei verschiedenen Anbietern unterschiedliche Token-Anzahlen: Tokenisierer-Wortschatz, Byte-Fallback-Regeln und Leerzeichenbehandlung unterscheiden sich.
- Verbindliche Zählung ist die API-Antwort usage.prompt_tokens / usage.completion_tokens (OpenAI) bzw. usage.input_tokens / usage.output_tokens (Anthropic).
Beispiele
Kurze englische Phrase unter GPT-4
Eingabe: Hello, world!
Modell: GPT-4 (cl100k_base)
Tokens: 4 -> ["Hello", ",", " world", "!"]
Zeichen: 13
Verhältnis: 3,25 Zeichen/TokenChinesischer Text benötigt mehr Tokens pro Zeichen
Eingabe: 你好,世界! (Hello, world! auf Chinesisch)
GPT-4: ~8 Tokens (1,5 Zeichen/Token)
DeepSeek V3: ~4 Tokens (2 Zeichen/Token, optimiert für CJK)
Claude 3.5: ~7 TokensKosten für einen 1.000-Wörter-Artikel schätzen
Eingabe: 1.000 englische Wörter (~1.330 Tokens)
Erwartete Ausgabe: 500 Tokens
Modell: GPT-4o ($2,50 Eingabe / $10,00 Ausgabe pro 1M Tokens)
Eingabekosten: 1.330 / 1.000.000 * $2,50 = $0,00333
Ausgabekosten: 500 / 1.000.000 * $10,00 = $0,00500
Gesamt: ~$0,0083 pro AnfrageFaustregel: ~75 Wörter = ~100 Tokens (Englisch)
Absatz (75 Wörter):
"The quick brown fox jumps over the lazy dog. Pack my box with five
dozen liquor jugs. How vexingly quick daft zebras jump! The five
boxing wizards jump quickly. Sphinx of black quartz, judge my vow."
GPT-4-Tokens: ~100
Claude-Tokens: ~95Chunk-Größe vor dem Einbetten in eine Vektor-Datenbank
Ziel-Chunk: 512 Tokens (text-embedding-3-small Limit: 8191)
Englischer Text: ~384 Wörter pro Chunk
Chinesischer Text: ~768 Zeichen pro Chunk (GPT-Tokenizer)
Überlappung: 50 Tokens zwischen Chunks (bewahrt Kontext)FAQ
Welchen Tokenizer verwendet der Counter?
Üblicherweise OpenAIs tiktoken (cl100k_base für GPT-4, GPT-3.5; o200k_base für GPT-4o), teils auch den Claude-Tokenizer von Anthropic oder Hugging-Face-Tokenizer für Open Models. Verschiedene Modelle teilen Text unterschiedlich auf, daher unterscheidet sich die Tokenzahl je nach Modell.
Warum stimmt die Tokenzahl nicht mit der Wortzahl überein?
Tokens sind Sub-Wort-Einheiten. 'Hello world' sind 2 Tokens; 'antidisestablishmentarianism' sind 5-6 Tokens. Im Englischen entspricht ein Token im Schnitt etwa 0,75 Wörtern (1000 Tokens ≈ 750 Wörter). Andere Sprachen sind dichter - chinesische Schriftzeichen sind oft 1-2 Tokens pro Zeichen.
Wird mein Prompt hochgeladen?
Nein. Der Tokenizer läuft in deinem Browser - tiktoken hat einen JavaScript-Port, der die Kodierung lokal erledigt. Dein Prompt verlässt das Netzwerk nicht.
Wie genau ist die Kostenschätzung?
Die Tokenzahl ist exakt. Die Kostensumme hängt vom Preis pro 1K Tokens für das gewählte Modell ab, den die Seite aus einer veröffentlichten Preisliste übernimmt. Preisänderungen der Anbieter werden bei einem Seiten-Update übernommen; bei budgetkritischen Entscheidungen prüfe noch einmal die aktuelle Preisliste.
Warum weichen meine Zahlen leicht von OpenAIs Playground ab?
Verschiedene tiktoken-Versionen können sich geringfügig unterscheiden. Spezial-Tokens (Chat-Nachrichten haben Role-/System-Framing-Tokens) fügen pro Nachricht ein paar Tokens hinzu, die ein unstrukturierter Counter womöglich nicht mitzählt. Für die exakte API-Abrechnung zähle das, was dein Code tatsächlich sendet.
Wie geht der Tokenizer mit Code, JSON und strukturierten Daten um?
Tokenizer zerlegen Satzzeichen, Klammern und Whitespace in viele kleine Tokens. JSON ist sehr dicht - schon ein kleines JSON-Objekt kann 50+ Tokens belegen. Code verbraucht mehr Tokens als gleichwertige Prosa. Plane das ein, wenn du JSON oder Code an ein Modell mit knappem Kontextfenster sendest.
Kann ich Tokens für ein nicht aufgeführtes Modell zählen?
Nur wenn dessen Tokenizer im Browser verfügbar ist. Verbreitete Tokenizer (GPT, Claude, Llama) haben JS-Implementierungen. Für seltene oder proprietäre Modelle nutze den offiziellen Counter des Anbieters oder schätze grob (4 Zeichen ≈ 1 Token im Englischen).