Token-Zähler

Schätzen Sie die Token-Anzahl in KI-Modellen mit Preisen für wichtige LLM

Text eingeben

Modell auswählen

Statistiken

Token-Anzahl0

Zeichen0

Chinesische Zeichen0

Wörter (Gesch.)0

Zeichen/Token-Verhältnis0

Geschätzte Kosten

Ausgabe-Tokens

Eingabe-Tokens0

Ausgabe-Tokens1,000

Gesamtkosten$0.0100

$2.50 pro 1M Eingabe-Tokens
$10.00 pro 1M Ausgabe-Tokens

Was ist ein Token?

Der Token-Zähler schätzt, wie ein Text von KI-Modellen in Verarbeitungseinheiten aufgeteilt wird. Ein Token ist nicht einfach ein Wort oder Zeichen: Es kann ein ganzes Wort, ein Wortteil, ein Satzzeichen oder bei manchen Sprachen auch ein einzelnes Zeichen sein. Die Zählung ist wichtig für Kontextfenster, Kostenabschätzung, Prompt-Design, RAG-Snippets, Chatverläufe und die Frage, ob eine Eingabe noch in ein Modell passt. Unterschiedliche Modellfamilien verwenden unterschiedliche Tokenizer, daher ist das Ergebnis immer modellabhängig. Das Werkzeug hilft, Texte vor dem Senden zu kürzen, aufzuteilen oder gezielt zu strukturieren, ersetzt aber keine finale Prüfung im tatsächlichen API-Modell.

Anleitung

Grundlegende Bedienung

Text im Eingabebereich eingeben oder einfügen.
Das Ziel-KI-Modell wählen (GPT-4, Claude, Gemini usw.).
Die geschätzte Token-Anzahl im rechten Bereich ansehen.
Die geschätzte Ausgabelänge festlegen, um die API-Kosten zu berechnen.

Tokenisierungsregeln

GPT-Serie: ~4 englische Zeichen = 1 Token, ~1,5 chinesische Zeichen = 1 Token
Claude-Serie: Ähnlich wie GPT mit leichten Unterschieden
DeepSeek-Serie: Auf Chinesisch optimiert, ~2 Zeichen = 1 Token
Sonderzeichen, Satzzeichen und Zeilenumbrüche verbrauchen ebenfalls Tokens
Strukturierter Text wie Code und JSON hat typischerweise eine höhere Token-Dichte

Anwendungsfälle

Prompt-Größe über Modellfamilien hinweg schätzenFügen Sie Text ein und wählen Sie aus Vorgaben für OpenAI, Claude, Gemini, Llama, Mistral oder DeepSeek. Der Schätzer verwendet unterschiedliche heuristische Koeffizienten für chinesische Zeichen, englische Wörter, Satzzeichen und Leerzeichen je nach gewählter Familie. Ein schneller Wechsel der Vorgaben zeigt, wie ein für einen Anbieter entworfener Prompt bei einem anderen abgerechnet wird – nützlich bei Vertragsverhandlungen.

Grobe Ein- und Ausgabekosten prognostizierenDas Panel kombiniert geschätzte Eingabe-Tokens mit einer vom Benutzer eingegebenen erwarteten Ausgabe-Token-Anzahl und modellspezifischen Preisen pro Tausend Tokens. Es zeigt Eingabe-Tokens, Ausgabe-Tokens und geschätzte Gesamtkosten für schnelle Budgetprüfungen. Für lang laufende Batch-Jobs multiplizieren Sie die Einzelanfrage-Schätzung mit der geplanten Anzahl von Anfragen, um die monatlichen Kosten vor Modellentscheidungen abzuschätzen.

Mehrsprachige Textzusammensetzung verstehenNeben der Token-Schätzung meldet das Tool Gesamtzeichen, chinesische Zeichenanzahl, Wortanzahl und das Zeichen-pro-Token-Verhältnis. Das ist nützlich beim Kürzen von Prompts, beim Vergleich chinesischer und englischer Entwürfe oder bei der Vorbereitung von Inhalten für Modell-Kontextlimits. Ein hohes Zeichen-pro-Token-Verhältnis bedeutet, dass der Tokenizer mehr Text pro Token packt, was die Kosten pro Seite typischerweise senkt.

Tokenizer-Schätzungen nebeneinander vergleichenWechseln Sie die Modellvorgabe zwischen GPT, Claude und Gemini bei gleichem Text, um zu sehen, wie sich die Kosten für Chinesisch vs. Englisch verschieben – nützlich beim Portieren eines Prompts zwischen Anbietern oder bei der Schätzung der Chunk-Größe für eine RAG-Pipeline. Der Unterschied zwischen BPE- und SentencePiece-Tokenizer wird sichtbar: BPE tendiert dazu, seltene Wörter in mehr Subword-Tokens aufzuteilen, während SentencePiece (von Llama und Mistral verwendet) Leerzeichen anders aufteilen und chinesische Zeichen als größere Einheiten behandeln kann.

Chunks vor Embedding oder Retrieval dimensionierenRichten Sie jeden Abschnitt auf den Kontextausschnitt des gewählten Modells aus (z. B. 512 oder 1024 Tokens), kopieren Sie den Grenzsatz in den Splitter und versehen Sie Chunks mit ihrer Token-Anzahl für nachgelagerte Retrieval-Indizes. Der exakte cl100k_base-Vokabular von GPT-4o, o200k_base für neuere OpenAI-Modelle und Claudes ca. 100.000-Symbol-SentencePiece-Vokabular erzeugen bei gleichem Dokument unterschiedliche Chunk-Grenzen.

Technisches Prinzip

Moderne LLM-Tokenisierer verwenden Subword-Algorithmen — hauptsächlich Byte Pair Encoding (BPE) und SentencePiece — statt einer Trennung an Leerzeichen. BPE startet von einzelnen Bytes und führt iterativ die häufigsten benachbarten Paare zusammen, wodurch ein fester Wortschatz von typischerweise 32k–200k Symbolen entsteht. Häufige Wörter werden zu einzelnen Tokens, seltene Wörter zerfallen in mehrere Subwords, und beliebige Bytes (Emoji, Steuerzeichen) werden dennoch sicher kodiert, da das Alphabet alle 256 Bytes abdeckt. SentencePiece (verwendet von Llama, Mistral, Gemini-Varianten) behandelt Leerzeichen als reguläres Zeichen über den ▁-Marker, sodass führende Leerzeichen zum Teil des nächsten Tokens werden — daher sind ` hello` und `hello` in der Regel unterschiedliche Token-IDs. OpenAI veröffentlicht drei Haupt-BPE-Wortschatze über die tiktoken-Bibliothek: p50k_base (50.281 Tokens, GPT-3 / Codex), cl100k_base (100.277 Tokens, GPT-3.5 Turbo und GPT-4) sowie o200k_base (~200k Tokens, GPT-4o und o1), der die Nicht-Englisch-Abdeckung erweitert und die Token-Anzahl für Chinesisch/Japanisch um etwa das 1,4- bis 1,7-fache reduziert. Claude verwendet einen verwandten, proprietären Tokenisierer mit ähnlicher Wortschatzgröße. Als grobe Richtwerte gilt: Englischer Text durchschnittlich ~4 Zeichen pro Token, Chinesisch ~1,5–2 Zeichen pro Token bei cl100k_base und ~2 bei o200k_base, und ein einzelnes Emoji verbraucht oft 2–5 Tokens, da es als mehrere UTF-8-Bytes kodiert wird. Die Token-Anzahl bestimmt sowohl die Nutzung des Kontextfensters als auch die Kosten. Aktuelle Fenster umfassen GPT-4o 128k, Claude 3.5 Sonnet 200k und Gemini 1.5 Pro 2M; die Abrechnung erfolgt als tokens × Preis pro 1M, wobei Eingabe und Ausgabe separat bepreist werden (z. B. GPT-4o mit 2,50 $/10,00 $ pro 1M, Claude 3.5 Sonnet mit 3,00 $/15,00 $). Dieser Zähler verwendet heuristische Koeffizienten pro Familie, da die Auslieferung jedes Tokenisierer-Wortschatzes Megabytes an Daten bedeuten würde — das Ergebnis ist daher eine Arbeitsschätzung. Die verbindliche Zahl steht im usage-Feld der API-Antwort des Modells.

BPE führt häufige Byte-Paare zu einem festen Wortschatz zusammen; OpenAI-Wortschatze sind cl100k_base (GPT-4/3.5), o200k_base (GPT-4o/o1), p50k_base (Codex).
SentencePiece kodiert führende Leerzeichen als ▁, sodass ` world` und `world` in Llama/Mistral/Gemini unterschiedliche Token-IDs ergeben.
Englisch-Heuristik ca. 4 Zeichen/Token; CJK ca. 1,5–2 Zeichen/Token bei cl100k_base, ca. 2 bei o200k_base; Emoji typischerweise 2–5 Tokens pro Zeichen.
Kostenformel: (Eingabe-Tokens / 1.000.000) × Eingabe-Preis + (Ausgabe-Tokens / 1.000.000) × Ausgabe-Preis, wobei Eingabe und Ausgabe separat bepreist werden.
Kontextfenster 2025: GPT-4o 128k, GPT-4 Turbo 128k, Claude 3.5 Sonnet 200k, Gemini 1.5 Pro 2M, DeepSeek V3 128k.
Derselbe Text ergibt bei verschiedenen Anbietern unterschiedliche Token-Anzahlen: Tokenisierer-Wortschatz, Byte-Fallback-Regeln und Leerzeichenbehandlung unterscheiden sich.
Verbindliche Zählung ist die API-Antwort usage.prompt_tokens / usage.completion_tokens (OpenAI) bzw. usage.input_tokens / usage.output_tokens (Anthropic).

Beispiele

Kurze englische Phrase unter GPT-4

Eingabe:    Hello, world!
Modell:    GPT-4 (cl100k_base)
Tokens:   4   ->  ["Hello", ",", " world", "!"]
Zeichen:    13
Verhältnis:    3,25 Zeichen/Token

Chinesischer Text benötigt mehr Tokens pro Zeichen

Eingabe:    你好，世界！  (Hello, world! auf Chinesisch)
GPT-4:        ~8 Tokens (1,5 Zeichen/Token)
DeepSeek V3:  ~4 Tokens (2 Zeichen/Token, optimiert für CJK)
Claude 3.5:   ~7 Tokens

Kosten für einen 1.000-Wörter-Artikel schätzen

Eingabe:        1.000 englische Wörter (~1.330 Tokens)
Erwartete Ausgabe: 500 Tokens
Modell:        GPT-4o ($2,50 Eingabe / $10,00 Ausgabe pro 1M Tokens)

Eingabekosten:   1.330 / 1.000.000 * $2,50 = $0,00333
Ausgabekosten:  500   / 1.000.000 * $10,00 = $0,00500
Gesamt:        ~$0,0083 pro Anfrage

Faustregel: ~75 Wörter = ~100 Tokens (Englisch)

Absatz (75 Wörter):
"The quick brown fox jumps over the lazy dog. Pack my box with five
dozen liquor jugs. How vexingly quick daft zebras jump! The five
boxing wizards jump quickly. Sphinx of black quartz, judge my vow."

GPT-4-Tokens: ~100
Claude-Tokens: ~95

Chunk-Größe vor dem Einbetten in eine Vektor-Datenbank

Ziel-Chunk: 512 Tokens (text-embedding-3-small Limit: 8191)
Englischer Text:  ~384 Wörter pro Chunk
Chinesischer Text:  ~768 Zeichen pro Chunk (GPT-Tokenizer)

Überlappung:       50 Tokens zwischen Chunks (bewahrt Kontext)

FAQ

Welchen Tokenizer verwendet der Counter?

Üblicherweise OpenAIs tiktoken (cl100k_base für GPT-4, GPT-3.5; o200k_base für GPT-4o), teils auch den Claude-Tokenizer von Anthropic oder Hugging-Face-Tokenizer für Open Models. Verschiedene Modelle teilen Text unterschiedlich auf, daher unterscheidet sich die Tokenzahl je nach Modell.

Warum stimmt die Tokenzahl nicht mit der Wortzahl überein?

Tokens sind Sub-Wort-Einheiten. 'Hello world' sind 2 Tokens; 'antidisestablishmentarianism' sind 5-6 Tokens. Im Englischen entspricht ein Token im Schnitt etwa 0,75 Wörtern (1000 Tokens ≈ 750 Wörter). Andere Sprachen sind dichter - chinesische Schriftzeichen sind oft 1-2 Tokens pro Zeichen.

Wird mein Prompt hochgeladen?

Nein. Der Tokenizer läuft in deinem Browser - tiktoken hat einen JavaScript-Port, der die Kodierung lokal erledigt. Dein Prompt verlässt das Netzwerk nicht.

Wie genau ist die Kostenschätzung?

Die Tokenzahl ist exakt. Die Kostensumme hängt vom Preis pro 1K Tokens für das gewählte Modell ab, den die Seite aus einer veröffentlichten Preisliste übernimmt. Preisänderungen der Anbieter werden bei einem Seiten-Update übernommen; bei budgetkritischen Entscheidungen prüfe noch einmal die aktuelle Preisliste.

Warum weichen meine Zahlen leicht von OpenAIs Playground ab?

Verschiedene tiktoken-Versionen können sich geringfügig unterscheiden. Spezial-Tokens (Chat-Nachrichten haben Role-/System-Framing-Tokens) fügen pro Nachricht ein paar Tokens hinzu, die ein unstrukturierter Counter womöglich nicht mitzählt. Für die exakte API-Abrechnung zähle das, was dein Code tatsächlich sendet.

Wie geht der Tokenizer mit Code, JSON und strukturierten Daten um?

Tokenizer zerlegen Satzzeichen, Klammern und Whitespace in viele kleine Tokens. JSON ist sehr dicht - schon ein kleines JSON-Objekt kann 50+ Tokens belegen. Code verbraucht mehr Tokens als gleichwertige Prosa. Plane das ein, wenn du JSON oder Code an ein Modell mit knappem Kontextfenster sendest.

Kann ich Tokens für ein nicht aufgeführtes Modell zählen?

Nur wenn dessen Tokenizer im Browser verfügbar ist. Verbreitete Tokenizer (GPT, Claude, Llama) haben JS-Implementierungen. Für seltene oder proprietäre Modelle nutze den offiziellen Counter des Anbieters oder schätze grob (4 Zeichen ≈ 1 Token im Englischen).