URL Kodier- und Dekodierwerkzeug

Schnelle URL-Kodierung und -Dekodierung, mehrere Kodierungsmodi unterstützt

Eingabe

Zeichen: 0

Bytes: 0

Ausgabe

Zeichen: 0

Bytes: 0

Konvertierungsmethode wählen

Was ist URL-Kodierung?

Die URL-Kodierung (auch Prozent-Kodierung genannt) ist ein Mechanismus zur Umwandlung von Zeichen in ein Format, das sicher in einer URL übertragen werden kann. Da URLs nur bestimmte Zeichen aus dem ASCII-Zeichensatz enthalten dürfen, müssen andere Zeichen (wie Umlaute, Leerzeichen und Sonderzeichen) als %XX-Format kodiert werden, wobei XX der hexadezimale Wert des Zeichens ist. Beispiel: Ein Leerzeichen wird als %20 kodiert, und das Zeichen ö wird als %C3%B6 kodiert. URL-Encoding wandelt Zeichen in eine Form um, die sicher in URLs übertragen werden kann. Leerzeichen, Nicht-ASCII-Zeichen, Reserved Characters und Sonderzeichen werden je nach Kontext prozentkodiert. Wichtig ist die Unterscheidung zwischen kompletter URL, Pfadsegment, Query-Parameter und Fragment, weil nicht überall dieselben Zeichen maskiert werden sollen. Doppelte Kodierung oder fehlende Kodierung kann Links, Signaturen, API-Requests und Weiterleitungen beschädigen.

So verwenden Sie es

Geben Sie den zu kodierenden/dekodierenden Text ein oder fügen Sie ihn in das Eingabefeld ein
Wählen Sie die Kodierungsmethode: encodeURIComponent oder encodeURI
Ergebnisse erscheinen automatisch – mit einem Klick kopieren oder Eingabe und Ausgabe tauschen
Zum Dekodieren wählen Sie die entsprechende Dekodierungsmethode

URL-Kontext

Verwenden Sie die Komponentenkodierung für Abfragewerte und Pfadsegmente; das Kodieren einer vollständigen URL mit der falschen Funktion kann Trennzeichen wie /, ? und & beschädigen.
Überprüfen Sie beim Dekodieren auf doppelte Kodierung wie %2520, was bedeutet, dass ein Prozentzeichen erneut kodiert wurde.

Anwendungsfälle

Query-Parameter sicher kodierenVerwenden Sie den encodeURIComponent-Modus, wenn ein Wert in einem URL-Query-Parameter, Pfadsegment oder formartigen Payload untergebracht wird. Er kodiert reservierte Zeichen aggressiver als encodeURI und zeigt sowohl Zeichen- als auch Byteanzahl. Das Ergebnis ist das, was die meisten serverseitigen Parser nach einem Fragezeichen oder innerhalb eines JSON-Segmentes erwarten.

Ganze URLs kodieren oder dekodierenWechseln Sie zu encodeURI oder decodeURI, wenn Sie mit einer gesamten URL arbeiten und Trennzeichen wie : / ? & ihre strukturelle Bedeutung behalten sollen. Komponenten- und Voll-URI-Modi sind getrennt gehalten, um versehentliche Überkodierung zu vermeiden. Das ist die richtige Wahl, wenn die Eingabe bereits wie eine URL aussieht und nur die Benutzerdaten-Teile verschärft werden müssen.

Lesbaren Text aus Prozent-Escapes wiederherstellenDekodieren Sie Komponenten- oder Voll-URI-Strings und tauschen Sie gültige Ausgaben mit dem Gegenmodus zurück in die Eingabe. Transformationsfehler durch fehlerhafte Prozentsequenzen werden in der Ausgabe angezeigt und vom Tausch blockiert, sodass ein unvollständiges %XX nicht eine spätere Kopier-Einfüge-Aktion verunreinigt. Doppelt kodierte Fragmente wie %2520 werden als verschachtelte Escapes angezeigt, die einen zweiten Dekodierdurchlauf benötigen.

Kodierte Form-Body analysierenWechseln Sie zur application/x-www-form-urlencoded-Ansicht, um zu sehen, wie sich '+' und '%20' bei Leerzeichen unterscheiden, und dekodieren Sie einen aus den DevTools kopierten x-www-form-urlencoded-Payload, um die Originalschlüssel wiederherzustellen. Das hilft auch beim Lesen des Body einer POST-Anfrage, um zu bestätigen, dass das Formular tatsächlich das gesendet hat, was das Client-JavaScript beabsichtigt hat. RFC 3986 reserviert eine eigene Regel für Form-Body, weshalb '+' in vielen APIs erhalten bleibt.

Reservierte vs. nicht-reservierte Zeichen gemäß RFC 3986 unterscheidenBeim Debuggen einer Signaturdiskrepanz oder eines 400-Fehlers von einer strengen API besteht der erste Schritt darin zu prüfen, ob jedes Byte zur reservierten Menge (gen-delims : / ? # [ ] @ und sub-delims !$&'()*+,;=) oder zur nicht-reservierten Menge (A-Z a-z 0-9 - . _ ~) gehört. Query-Werte verwenden Prozentkodierung für reservierte Zeichen, während Pfadsegmente '/' als strukturell behandeln. Die Wahl von %20 für Leerzeichen oder '+' für Form-Body ergibt sich direkt aus der Position, an der der kodierte Wert stehen wird – derselbe String kann je nach URL-Platz legal in drei verschiedenen Kodierungen vorkommen.

Technisches Prinzip

Die URL-Kodierung (Prozentkodierung) ist in RFC 3986 §2.1 definiert und wandelt Zeichen in das Format %XX um, wobei XX die zweistellige Großbuchstaben-Hexadezimaldarstellung des Bytewerts in UTF-8 ist. Die RFC definiert zwei Zeichenklassen: nicht reservierte Zeichen (A-Z a-z 0-9 - _ . ~), die niemals kodiert werden, und reservierte Zeichen (gen-delims : / ? # [ ] @ und sub-delims ! $ & ' ( ) * + , ; =), deren Kodierung vom Kontext abhängt — sie tragen in manchen URL-Komponenten strukturelle Bedeutung, sind in anderen jedoch Literaldaten. JavaScript stellt zwei integrierte Funktionen mit unterschiedlichem Geltungsbereich bereit. encodeURIComponent() kodiert jedes Zeichen außer A-Z a-z 0-9 - _ . ! ~ * ' ( ) — dies ist die richtige Wahl für die Kodierung einzelner Query-Parameterwerte, Pfadsegmente und Fragment-Identifikatoren. encodeURI() bewahrt zusätzlich die strukturellen Zeichen : / ? # [ ] @ ! $ & ' ( ) * + , ; = und ist dafür ausgelegt, vollständige URIs zu kodieren, ohne deren syntaktische Struktur zu verändern. Der entscheidende Unterschied besteht darin, dass encodeURIComponent() / und & kodiert, was eine URL zerstören würde, wenn es auf den gesamten String angewendet wird, während encodeURI() diese beibehält. Die Behandlung von Leerzeichen ist die häufigste Interoperabilitätsfalle. RFC 3986 schreibt %20 als kanonische Prozentkodierung für das Leerzeichen (U+0020) vor. Der MIME-Typ application/x-www-form-urlencoded (verwendet bei HTML-Formularübermittlungen seit HTML 4.01) kodiert Leerzeichen jedoch als +. Die beiden sind nicht austauschbar: Ein Server, der %20 erwartet, interpretiert + als Literalzeichen, und ein Server, der + erwartet, behandelt %20 als Prozentzeichen gefolgt von 20. Das Tool verwendet encodeURIComponent(), das %20 erzeugt und damit RFC 3986 entspricht. Benutzer, die x-www-form-urlencoded-Payloads dekodieren (aus POST-Bodies oder von Legacy-Middleware geparsten Query-Strings), sollten diesen Unterschied kennen. Die Behandlung von Mehrbytezeichen erfolgt automatisch, ist aber verständlich: Der Eingabestring wird zunächst in UTF-8-Bytes kodiert, dann wird jedes Byte einzeln prozentkodiert. Ein CJK-Zeichen wie 你 (U+4F60) belegt 3 UTF-8-Bytes (E4 BD A0) und ergibt %E4%BD%A0. Wenn der Server mit einem anderen Zeichensatz wie GBK parst, wird dasselbe Zeichen zu %C4%E3 (2 Bytes) kodiert, und das Dekodierungsergebnis wird unleserlich, sofern sich beide Seiten nicht auf UTF-8 geeinigt haben. Doppelkodierung ist ein weiterer häufiger Fehler: %2520 bedeutet ein literalen Prozentzeichen (%25) gefolgt von 20, was darauf hinweist, dass die Eingabe bereits prozentkodiert war und ein zweites Mal kodiert wurde. Der Dekodierungsmodus erkennt fehlerhafte Sequenzen (unvollständige %XX) und meldet den Fehler, anstatt stillschweigend Unsinn auszugeben.

encodeURIComponent vs. encodeURI: encodeURIComponent kodiert / ? & # und ist korrekt für Query-Werte, Pfadsegmente und Fragmente; encodeURI bewahrt diese strukturellen Zeichen und ist korrekt für vollständige URLs — die Verwendung der falschen Funktion ist der häufigste URL-Kodierungsfehler.
Reservierte Zeichenklassen gemäß RFC 3986: gen-delims (: / ? # [ ] @) tragen URL-Syntax; sub-delims (! $ & ' ( ) * + , ; =) können Trennzeichen oder Daten sein, je nach URL-Komponente — der Kontext bestimmt, ob ein reserviertes Zeichen prozentkodiert wird.
Leerzeichenkodierung: Die kanonische Form gemäß RFC 3986 ist %20 (erzeugt von encodeURIComponent); application/x-www-form-urlencoded verwendet + (HTML-Formular-Standard) — die beiden sind semantisch inkompatibel, und ihre Vermischung zerstört serverseitige Parser.
UTF-8-Multibyte-Kodierung: 你 (U+4F60) → UTF-8-Bytes E4 BD A0 → %E4%BD%A0 (3 prozentkodierte Oktette); dasselbe Zeichen unter GBK → %C4%E3 (2 Oktette) — die Einigung auf einen Zeichensatz zwischen Client und Server ist für Nicht-ASCII-Text zwingend erforderlich.
Doppelkodierungs-Erkennung: %2520 wird zunächst zu %20 und dann zu Leerzeichen dekodiert — die Ausgabe des Dekodierungsmodus zeigt dieses Muster; fehlerhafte Sequenzen wie %ZZ oder %2 (unvollständig) werden erkannt und als Fehler gemeldet.
IRI (RFC 3987): Internationalized Resource Identifiers erlauben Unicode-Zeichen direkt in URLs; Browser zeigen die dekodierte Form in der Adressleiste an, übertragen aber die prozentkodierte UTF-8-Form über das Netzwerk — der Kodierungsmodus des Tools zeigt, was tatsächlich über HTTP gesendet wird.
decodeURIComponent-Fehlerbehandlung: Ein String mit einer unvollständigen Prozentsequenz (% gefolgt von weniger als 2 Hexadezimalziffern) löst einen URIError aus — das Tool kapselt den Aufruf in try/catch und zeigt die Fehlermeldung an, anstatt stillschweigend einen leeren String zurückzugeben.

Beispiele

Chinesische Zeichen kodieren (UTF-8 Prozent-Kodierung)

Eingabe:  你好世界 (4 CJK-Zeichen, 12 UTF-8-Bytes)
Ausgabe: %E4%BD%A0%E5%A5%BD%E4%B8%96%E7%95%8C

Jedes UTF-8-Byte (E4, BD, A0, ...) wird zu %XX
RFC: RFC 3986 Abschnitt 2.1 definiert Prozent-Kodierung für URIs
Verwendung: Query-Parameter, Pfadsegmente, Formulardaten-Übermittlung

Query-String-Trennzeichen kodieren

Eingabe:  name=张三&age=20
Ausgabe: name%3D%E5%BC%A0%E4%B8%89%26age%3D20

%3D kodiert '=' (Trennzeichen zwischen Schlüssel und Wert)
%26 kodiert '&' (Trennzeichen zwischen Parametern)
RFC: RFC 3986 Abschnitt 3.4 definiert reservierte Zeichen der Query-Komponente

Vollständige URL kodieren (teilweise Kodierung)

Eingabe:  https://example.com/search?q=你好&type=web
Ausgabe: https://example.com/search?q=%E4%BD%A0%E5%A5%BD&type=web

Hinweis: Schema, Host und vorhandene Trennzeichen werden NICHT kodiert
Nur der Nicht-ASCII-Query-Wert wird prozent-kodiert
RFC: RFC 3986 Abschnitt 3 definiert hierarchische URI-Komponenten

Leerzeichen kodieren (zwei Konventionen)

Pfadsegment:  %20 (RFC 3986-konform)
Query-String:  + (historische HTML-Formular-Konvention)

Beispiel: /search for me -> /search%20for%20me
Beispiel: q=hello world -> q=hello+world

Beide dekodieren zum gleichen Ergebnis; encodeURI verwendet %20, encodeURIComponent verwendet %20 für Pfade, in einigen Implementierungen + für Queries

FAQ

Was macht URL-Encoding?

Es ersetzt unsichere Zeichen in URLs durch %-Sequenzen: Leerzeichen → %20, & → %26, # → %23 usw. RFC 3986 listet auf, welche Zeichen sicher sind (Buchstaben, Ziffern sowie -, _, ., ~) und welche kodiert werden müssen. Browser, Server und HTTP-Bibliotheken wenden URL-Encoding an den passenden Stellen an oder erwarten es dort.

Was ist der Unterschied zwischen encodeURI und encodeURIComponent?

encodeURI lässt URL-Syntaxzeichen (: / ? # & =) unangetastet - es erwartet eine vollständige URL. encodeURIComponent kodiert auch diese - es erwartet einen einzelnen Parameterwert. Die Seite stellt beide Modi bereit; nimm Component-Encoding für Query-Parameter und URI-Encoding für vollständige URLs.

Warum wird ein Leerzeichen mal zu %20 und mal zu +?

%20 ist der URI-Standard. + ist die Altkonvention für den MIME-Typ application/x-www-form-urlencoded, den HTML-Formular-Übermittlungen verwenden. Für die meisten Server sieht das gleich aus, ist aber nicht streng äquivalent - in modernen URLs nutze %20.

Soll ich Unicode-Zeichen kodieren?

RFC 3986 erlaubt nur ASCII; Nicht-ASCII muss in UTF-8 kodiert und dann prozent-escaped werden (中 → %E4%B8%AD). Moderne Browser zeigen die Unicode-Form in der Adressleiste, senden aber die kodierte Form über die Leitung. Den UTF-8-Schritt erledigt die Seite automatisch.

Welche Zeichen sollten nie kodiert werden?

Die unreservierten Zeichen nach RFC 3986: A-Z, a-z, 0-9, -, _, ., ~. Sie zu kodieren ist technisch erlaubt, erzeugt aber einen anderen URL-String; je nach Kanonisierungsregeln behandeln Server 'a' und '%61' entweder als gleichwertig oder als unterschiedlich.

Warum hat meine dekodierte URL seltsame Zeichen?

Wahrscheinlich doppelt kodiert: %2520 dekodiert zu %20, dann zu Leerzeichen - jemand hat die URL also zweimal kodiert. Dann musst du sie auch zweimal dekodieren. Manche Server kodieren automatisch doppelt; prüfe das Encoding-Verhalten deines Clients.

Erfolgt das Encoding lokal?

Ja. encodeURIComponent und decodeURIComponent laufen in deinem Browser. URLs werden nicht hochgeladen.

URL Kodier- und Dekodierwerkzeug

Konvertierungsmethode wählen

Was ist URL-Kodierung?

So verwenden Sie es

So verwenden Sie es

URL-Kontext

Anwendungsfälle

Technisches Prinzip

Beispiele

Chinesische Zeichen kodieren (UTF-8 Prozent-Kodierung)

Query-String-Trennzeichen kodieren

Vollständige URL kodieren (teilweise Kodierung)

Leerzeichen kodieren (zwei Konventionen)

FAQ

Was macht URL-Encoding?

Was ist der Unterschied zwischen encodeURI und encodeURIComponent?

Warum wird ein Leerzeichen mal zu %20 und mal zu +?

Soll ich Unicode-Zeichen kodieren?

Welche Zeichen sollten nie kodiert werden?

Warum hat meine dekodierte URL seltsame Zeichen?

Erfolgt das Encoding lokal?

Verwandte Tools

Base64-Kodier-Dekodier-Tool

HTML-Entitätskodierungstool

Unicode-Konverter

JSON-Escape-Tool

QR-Code Generator

IP-Adressabfragetool