ToolActToolAct

CSV-Datengenerator

Spalten regelbasiert definieren, strukturierte Testdaten erzeugen und als .csv exportieren

Bis zu 50.000 Zeilen

Spaltendefinitionen

Datenvorschau

Es werden nur die ersten 10 Zeilen angezeigt; beim Export werden alle erzeugt

Es werden nur die ersten 10 Zeilen angezeigt; beim Export werden alle erzeugt

Was ist der CSV-Datengenerator?

Der CSV-Datengenerator ist ein Online-Werkzeug zum stapelweisen Erzeugen strukturierter Testdaten und zum Export als Standard-.csv-Datei. Für jede Spalte wählst du einen Datentyp — Name, Telefon, Ausweis, Datum, Geldbetrag, UUID und mehr —, legst die Zeilenzahl fest und erhältst regelkonforme Mock-Daten. Du kannst zudem das Trennzeichen wählen (Komma, Semikolon, Tabulator oder Pipe), festlegen, ob eine Kopfzeile einbezogen wird, und ob ein UTF-8 BOM vorangestellt wird, damit Excel die Datei ohne Zeichensalat öffnet. Alle Daten werden lokal in deinem Browser erzeugt und nie auf einen Server hochgeladen, ideal zum Füllen von Datenbanken in Entwicklung und Test, zum Beleben von Demo-Oberflächen oder für Unterricht und Präsentationen. Das Werkzeug unterstützt lokalisierte Scheindaten in zehn Sprachen: Wählst du eine Daten-Sprache, werden Felder wie Name, Firma, Stadt und Telefon in den echten Konventionen dieser Region erzeugt — japanische Namen für Japanisch, koreanische Firmennamen für Koreanisch usw.

Anwendung

Schritte

  1. Wähle oben eine "Daten-Sprache", um den Stil lokalisierter Felder wie Name und Firma festzulegen
  2. Lege die Zeilenzahl fest oder wähle ein Schnell-Preset: 100 / 1Tsd. / 10Tsd. / 50Tsd.
  3. Wähle unter "CSV-Optionen" ein Trennzeichen, ein Zeilenende und leg fest, ob eine Kopfzeile und ein UTF-8 BOM einbezogen werden
  4. Füge unter "Spaltendefinitionen" Spalten einzeln hinzu: Name eintragen, Datentyp wählen und bei Bedarf Parameter (Zahlenbereich, Datumsbereich) setzen
  5. Klicke auf "Vorschau erzeugen", um die ersten 10 Zeilen zu prüfen, dann auf ".csv exportieren" zum Download oder auf "CSV kopieren", um den Text direkt zu übernehmen

Tipps

  • Nutze den Typ Enum mit kommagetrennten Werten für feste Ausprägungen wie Geschlecht, Status oder Stufe
  • Der Typ Regex erzeugt Strings aus einem eigenen Muster und deckt Fälle ab, die die eingebauten Typen nicht bieten
  • Wähle Semikolon oder Tabulator als Trennzeichen, wenn deine Daten Kommas enthalten, um Felder nicht zu zerreissen
  • Aktiviere das UTF-8 BOM, wenn du die CSV in Excel unter Windows öffnest, damit Chinesisch und andere Nicht-ASCII-Zeichen korrekt angezeigt werden
  • Nutze "CSV kopieren", um erzeugte Daten direkt in eine Tabelle oder einen Editor einzufügen, ohne eine Datei zu speichern

Anwendungsfälle

Datenbank-Import & TestsErzeuge Beispielzeilen und importiere sie per LOAD DATA oder COPY, um Feldtypen, Constraints und Abfrageperformance zu prüfen, ohne INSERT von Hand zu tippen.
UI-Prototypen & DemosExportiere das CSV und ziehe es per Drag & Drop in eine Tabellenkalkulation oder ein BI-Tool, um Prototypen, Berichte und Dashboards mit realistischen Daten zu füllen, die Demos nah ans echte Geschäft bringen.
Performance- & LasttestsErzeuge zehntausende CSV-Zeilen auf einmal und spiele sie über einen Batch-Import-Endpoint ein, um Durchsatz und Latenz von Paginierung, Export und Aggregation bei echtem Volumen zu messen.
Lehre & SchulungStelle für Kurse zu Datenbankimport, Datenanalyse oder ETL sofort Übungscsvs bereit, die Teilnehmende direkt in MySQL, Postgres oder Pandas importieren und sofort loslegen können.
Datenaustausch zwischen SystemenCSV ist die universelle Lingua franca zwischen Systemen. Erzeuge Mock-CSV-Dateien, um Import-Pipelines, ETL-Jobs und Datenmigrationen über verschiedene Plattformen hinweg zu testen.

Technisches Prinzip

Der Kern des Werkzeugs ist ein Satz von Generatoren, die nach Spaltentyp verteilen. Jede Spalte ist an einen Typ gebunden; bei der Erzeugung wird jede Zeile durchlaufen und die passende Generatorfunktion aufgerufen, was ein zweidimensionales Array ergibt. Die Typen fallen in zwei Gruppen. Die erste sind lokalisierte Scheindaten, angetrieben von den mehrsprachigen Locale-Modulen von @faker-js/faker: Je nach gewählter Daten-Sprache werden die regionspezifischen Generatoren für Name, Firma, Stadt und Telefon aufgerufen, sodass Japanisch japanische Namen und Koreanisch koreanische Adressen liefert. Die zweite sind formatierte Daten — Zahlen, Daten, Geldbeträge, UUID, IP, Ausweise u. a. —, die von eigenen reinen Funktionen erzeugt werden, wobei der chinesische Ausweis nach der Norm GB 11643 mit Berechnung der 18-stelligen Prüfziffer erzeugt wird. Anders als ein Tabellenkalkulationsformat hat CSV keine Zelltypen: Jeder Wert ist reiner Text. Daher wird jeder erzeugte Wert in einen lesbaren String serialisiert — Daten als ISO-Strings (yyyy-mm-dd), Geldbeträge mit Währungssymbol, Wahrheitswerte als true/false — und die Datei dann nach RFC 4180 zusammengesetzt: Jedes Feld, das das Trennzeichen, ein Anführungszeichen oder einen Zeilenumbruch enthält, wird in doppelte Anführungszeichen eingefasst und innere Anführungszeichen werden verdoppelt. Du kannst zwischen Komma, Semikolon, Tabulator und Pipe wechseln, CRLF- oder LF-Zeilenenden wählen und optional ein UTF-8 BOM voranstellen, damit Excel die Kodierung korrekt erkennt. Das Faker-Locale-Modul der gewählten Sprache wird dynamisch geladen und importiert nur das aktuell benötigte, statt alle zehn Sprachen in die Seite zu packen. Sämtliche Erzeugung und Export laufen lokal im Browser ab, ohne Upload. Die Zufallsquelle ist der eingebaute Pseudozufallsgenerator des Browsers: Ergebnisse innerhalb eines Laufs wiederholen sich nicht, sind aber nicht reproduzierbar; für reproduzierbare Daten lässt sich ein Seed fixieren (in einer künftigen Version unterstützt). Die Obergrenze von 50.000 Zeilen balanciert Speichernutzung und Exportzeit und deckt die weitaus meisten Test- und Demo-Bedürfnisse.

  • Verteilung nach Spaltentyp: lokalisierte Daten über Faker-Locale, formatierte Daten über eigene reine Funktionen
  • Faker-Locale wird dynamisch geladen und importiert nur die aktuelle Sprache, um die Bundle-Größe zu steuern
  • CSV folgt RFC 4180: Felder mit Trennzeichen, Anführungszeichen oder Zeilenumbruch werden eingefasst und innere Anführungszeichen verdoppelt
  • Ein optionales UTF-8 BOM sorgt dafür, dass Excel die Datei ohne Zeichensalat bei Nicht-ASCII-Text öffnet
  • Alles läuft lokal im Browser — keine Daten verlassen dein Gerät, die Privatsphäre bleibt gewahrt

Beispiele

Beispiel Benutzertabelle

Spalten:
  ID          -> Auto-Index (Start 1, Schritt 1)
  Name        -> Vollständiger Name
  E-Mail      -> E-Mail
  Telefon     -> Telefon
  Registriert -> Datum & Uhrzeit

Trennzeichen: Komma, Kopfzeile: ja, BOM: ja
Zeilen: 1000
Ausgabe: users.csv (1000 Zeilen)

Beispiel Bestellbeträge (Semikolon als Trennzeichen)

Spalten:
  Bestell-ID -> UUID
  Betrag     -> Geldbetrag (Min 10, Max 9999, 2 Dezimalen)
  Rabatt     -> Prozent (Min 0, Max 50)
  Status     -> Enum (offen, bezahlt, versendet, erledigt)

Trennzeichen: Semikolon (Beträge enthalten kein Komma, aber ein Semikolon vermeidet Locale-Fallen)
Ausgabe: orders.csv — in Excel öffnen oder direkt in eine Datenbank importieren.

Häufige Fragen

Werden die erzeugten Daten auf einen Server hochgeladen?

Nein. Alle Daten werden lokal in deinem Browser erzeugt und zusammengebaut. Das Tool sendet weder deine Spaltendefinitionen und Ergebnisse noch die exportierte CSV-Datei an einen Server, was es für vertrauliche Tabellenschemata und Feldanordnungen geeignet macht.

Wie hoch ist die maximale Zeilenzahl?

Bis zu 50.000 Zeilen pro Durchlauf. Das balanciert Browser-Speicher gegen die CSV-Erzeugungszeit und deckt die meisten Test-, Demo- und Datenbankimport-Szenarien. Für größere Mengen erzeuge stapelweise oder nutze ein Datenbank-Skript.

Warum brauchen Name und Firma eine "Daten-Sprache"?

Felder wie Name, Firma, Stadt und Telefon sind stark regionsspezifisch. Die Wahl der Datensprache lässt das Tool sie in den echten Konventionen dieser Region erzeugen — japanische Namen für Japanisch, koreanische Firmennamen für Koreanisch — damit deine CSV-Testdaten näher am echten Geschäft sind.

Warum sind Zahlen und Daten in der CSV reiner Text?

CSV ist ein rein textbasiertes Format ohne Zelltypen, sodass jeder Wert als String gespeichert wird. Zahlen, Geldbeträge, Daten und Ähnliches werden in lesbaren Text serialisiert. Wenn du native Zelltypen brauchst, die Excel berechnen kann, nutze stattdessen den Excel-Datengenerator.

Wann sollte ich das UTF-8 BOM einschalten?

Schalte es ein, wenn du die CSV in Excel unter Windows öffnest, besonders wenn die Daten Chinesisch oder andere Nicht-ASCII-Zeichen enthalten — das BOM sagt Excel, die Datei als UTF-8 zu lesen, und vermeidet Zeichensalat. Die meisten Datenbanken und Programmierwerkzeuge kommen auch ohne BOM mit UTF-8 zurecht, sodass du es dort weglassen kannst.

Welches Trennzeichen soll ich wählen?

Komma ist die Voreinstellung und am weitesten kompatibel. Wenn deine Daten selbst Kommas enthalten (etwa freie Adressen), wechsle zu Semikolon, Tabulator oder Pipe, um Felder nicht zu zerreissen. Einige europäische Locales verwenden ein Komma als Dezimaltrennzeichen; dort ist ein Semikolon als Trennzeichen die Konvention.

Wie erzeuge ich ein Format, das die eingebauten Typen nicht abdecken?

Nutze den Typ Regex, um Strings aus einem eigenen Muster zu erzeugen. Zum Beispiel liefert [A-Z]{3}\d{4} einen Code aus drei Großbuchstaben und vier Ziffern und deckt flexibel Fälle ab, die die eingebauten Typen nicht bieten.