CSV-Datengenerator
Spalten regelbasiert definieren, strukturierte Testdaten erzeugen und als .csv exportieren
Spaltendefinitionen
Datenvorschau
Es werden nur die ersten 10 Zeilen angezeigt; beim Export werden alle erzeugt
Es werden nur die ersten 10 Zeilen angezeigt; beim Export werden alle erzeugt
Was ist der CSV-Datengenerator?
Der CSV-Datengenerator ist ein Online-Werkzeug zum stapelweisen Erzeugen strukturierter Testdaten und zum Export als Standard-.csv-Datei. Für jede Spalte wählst du einen Datentyp — Name, Telefon, Ausweis, Datum, Geldbetrag, UUID und mehr —, legst die Zeilenzahl fest und erhältst regelkonforme Mock-Daten. Du kannst zudem das Trennzeichen wählen (Komma, Semikolon, Tabulator oder Pipe), festlegen, ob eine Kopfzeile einbezogen wird, und ob ein UTF-8 BOM vorangestellt wird, damit Excel die Datei ohne Zeichensalat öffnet. Alle Daten werden lokal in deinem Browser erzeugt und nie auf einen Server hochgeladen, ideal zum Füllen von Datenbanken in Entwicklung und Test, zum Beleben von Demo-Oberflächen oder für Unterricht und Präsentationen. Das Werkzeug unterstützt lokalisierte Scheindaten in zehn Sprachen: Wählst du eine Daten-Sprache, werden Felder wie Name, Firma, Stadt und Telefon in den echten Konventionen dieser Region erzeugt — japanische Namen für Japanisch, koreanische Firmennamen für Koreanisch usw.
Anwendung
Schritte
- Wähle oben eine "Daten-Sprache", um den Stil lokalisierter Felder wie Name und Firma festzulegen
- Lege die Zeilenzahl fest oder wähle ein Schnell-Preset: 100 / 1Tsd. / 10Tsd. / 50Tsd.
- Wähle unter "CSV-Optionen" ein Trennzeichen, ein Zeilenende und leg fest, ob eine Kopfzeile und ein UTF-8 BOM einbezogen werden
- Füge unter "Spaltendefinitionen" Spalten einzeln hinzu: Name eintragen, Datentyp wählen und bei Bedarf Parameter (Zahlenbereich, Datumsbereich) setzen
- Klicke auf "Vorschau erzeugen", um die ersten 10 Zeilen zu prüfen, dann auf ".csv exportieren" zum Download oder auf "CSV kopieren", um den Text direkt zu übernehmen
Tipps
- Nutze den Typ Enum mit kommagetrennten Werten für feste Ausprägungen wie Geschlecht, Status oder Stufe
- Der Typ Regex erzeugt Strings aus einem eigenen Muster und deckt Fälle ab, die die eingebauten Typen nicht bieten
- Wähle Semikolon oder Tabulator als Trennzeichen, wenn deine Daten Kommas enthalten, um Felder nicht zu zerreissen
- Aktiviere das UTF-8 BOM, wenn du die CSV in Excel unter Windows öffnest, damit Chinesisch und andere Nicht-ASCII-Zeichen korrekt angezeigt werden
- Nutze "CSV kopieren", um erzeugte Daten direkt in eine Tabelle oder einen Editor einzufügen, ohne eine Datei zu speichern
Anwendungsfälle
Technisches Prinzip
Der Kern des Werkzeugs ist ein Satz von Generatoren, die nach Spaltentyp verteilen. Jede Spalte ist an einen Typ gebunden; bei der Erzeugung wird jede Zeile durchlaufen und die passende Generatorfunktion aufgerufen, was ein zweidimensionales Array ergibt. Die Typen fallen in zwei Gruppen. Die erste sind lokalisierte Scheindaten, angetrieben von den mehrsprachigen Locale-Modulen von @faker-js/faker: Je nach gewählter Daten-Sprache werden die regionspezifischen Generatoren für Name, Firma, Stadt und Telefon aufgerufen, sodass Japanisch japanische Namen und Koreanisch koreanische Adressen liefert. Die zweite sind formatierte Daten — Zahlen, Daten, Geldbeträge, UUID, IP, Ausweise u. a. —, die von eigenen reinen Funktionen erzeugt werden, wobei der chinesische Ausweis nach der Norm GB 11643 mit Berechnung der 18-stelligen Prüfziffer erzeugt wird. Anders als ein Tabellenkalkulationsformat hat CSV keine Zelltypen: Jeder Wert ist reiner Text. Daher wird jeder erzeugte Wert in einen lesbaren String serialisiert — Daten als ISO-Strings (yyyy-mm-dd), Geldbeträge mit Währungssymbol, Wahrheitswerte als true/false — und die Datei dann nach RFC 4180 zusammengesetzt: Jedes Feld, das das Trennzeichen, ein Anführungszeichen oder einen Zeilenumbruch enthält, wird in doppelte Anführungszeichen eingefasst und innere Anführungszeichen werden verdoppelt. Du kannst zwischen Komma, Semikolon, Tabulator und Pipe wechseln, CRLF- oder LF-Zeilenenden wählen und optional ein UTF-8 BOM voranstellen, damit Excel die Kodierung korrekt erkennt. Das Faker-Locale-Modul der gewählten Sprache wird dynamisch geladen und importiert nur das aktuell benötigte, statt alle zehn Sprachen in die Seite zu packen. Sämtliche Erzeugung und Export laufen lokal im Browser ab, ohne Upload. Die Zufallsquelle ist der eingebaute Pseudozufallsgenerator des Browsers: Ergebnisse innerhalb eines Laufs wiederholen sich nicht, sind aber nicht reproduzierbar; für reproduzierbare Daten lässt sich ein Seed fixieren (in einer künftigen Version unterstützt). Die Obergrenze von 50.000 Zeilen balanciert Speichernutzung und Exportzeit und deckt die weitaus meisten Test- und Demo-Bedürfnisse.
- Verteilung nach Spaltentyp: lokalisierte Daten über Faker-Locale, formatierte Daten über eigene reine Funktionen
- Faker-Locale wird dynamisch geladen und importiert nur die aktuelle Sprache, um die Bundle-Größe zu steuern
- CSV folgt RFC 4180: Felder mit Trennzeichen, Anführungszeichen oder Zeilenumbruch werden eingefasst und innere Anführungszeichen verdoppelt
- Ein optionales UTF-8 BOM sorgt dafür, dass Excel die Datei ohne Zeichensalat bei Nicht-ASCII-Text öffnet
- Alles läuft lokal im Browser — keine Daten verlassen dein Gerät, die Privatsphäre bleibt gewahrt
Beispiele
Beispiel Benutzertabelle
Spalten:
ID -> Auto-Index (Start 1, Schritt 1)
Name -> Vollständiger Name
E-Mail -> E-Mail
Telefon -> Telefon
Registriert -> Datum & Uhrzeit
Trennzeichen: Komma, Kopfzeile: ja, BOM: ja
Zeilen: 1000
Ausgabe: users.csv (1000 Zeilen)Beispiel Bestellbeträge (Semikolon als Trennzeichen)
Spalten:
Bestell-ID -> UUID
Betrag -> Geldbetrag (Min 10, Max 9999, 2 Dezimalen)
Rabatt -> Prozent (Min 0, Max 50)
Status -> Enum (offen, bezahlt, versendet, erledigt)
Trennzeichen: Semikolon (Beträge enthalten kein Komma, aber ein Semikolon vermeidet Locale-Fallen)
Ausgabe: orders.csv — in Excel öffnen oder direkt in eine Datenbank importieren.Häufige Fragen
Werden die erzeugten Daten auf einen Server hochgeladen?
Nein. Alle Daten werden lokal in deinem Browser erzeugt und zusammengebaut. Das Tool sendet weder deine Spaltendefinitionen und Ergebnisse noch die exportierte CSV-Datei an einen Server, was es für vertrauliche Tabellenschemata und Feldanordnungen geeignet macht.
Wie hoch ist die maximale Zeilenzahl?
Bis zu 50.000 Zeilen pro Durchlauf. Das balanciert Browser-Speicher gegen die CSV-Erzeugungszeit und deckt die meisten Test-, Demo- und Datenbankimport-Szenarien. Für größere Mengen erzeuge stapelweise oder nutze ein Datenbank-Skript.
Warum brauchen Name und Firma eine "Daten-Sprache"?
Felder wie Name, Firma, Stadt und Telefon sind stark regionsspezifisch. Die Wahl der Datensprache lässt das Tool sie in den echten Konventionen dieser Region erzeugen — japanische Namen für Japanisch, koreanische Firmennamen für Koreanisch — damit deine CSV-Testdaten näher am echten Geschäft sind.
Warum sind Zahlen und Daten in der CSV reiner Text?
CSV ist ein rein textbasiertes Format ohne Zelltypen, sodass jeder Wert als String gespeichert wird. Zahlen, Geldbeträge, Daten und Ähnliches werden in lesbaren Text serialisiert. Wenn du native Zelltypen brauchst, die Excel berechnen kann, nutze stattdessen den Excel-Datengenerator.
Wann sollte ich das UTF-8 BOM einschalten?
Schalte es ein, wenn du die CSV in Excel unter Windows öffnest, besonders wenn die Daten Chinesisch oder andere Nicht-ASCII-Zeichen enthalten — das BOM sagt Excel, die Datei als UTF-8 zu lesen, und vermeidet Zeichensalat. Die meisten Datenbanken und Programmierwerkzeuge kommen auch ohne BOM mit UTF-8 zurecht, sodass du es dort weglassen kannst.
Welches Trennzeichen soll ich wählen?
Komma ist die Voreinstellung und am weitesten kompatibel. Wenn deine Daten selbst Kommas enthalten (etwa freie Adressen), wechsle zu Semikolon, Tabulator oder Pipe, um Felder nicht zu zerreissen. Einige europäische Locales verwenden ein Komma als Dezimaltrennzeichen; dort ist ein Semikolon als Trennzeichen die Konvention.
Wie erzeuge ich ein Format, das die eingebauten Typen nicht abdecken?
Nutze den Typ Regex, um Strings aus einem eigenen Muster zu erzeugen. Zum Beispiel liefert [A-Z]{3}\d{4} einen Code aus drei Großbuchstaben und vier Ziffern und deckt flexibel Fälle ab, die die eingebauten Typen nicht bieten.