ToolActToolAct

Générateur de données CSV

Définissez des colonnes par règle, générez des données de test structurées et exportez un fichier .csv

Jusqu’à 50 000 lignes

Définition des colonnes

Aperçu des données

Seules les 10 premières lignes sont affichées ; l’export génère toutes les lignes

Seules les 10 premières lignes sont affichées ; l’export génère toutes les lignes

Qu’est-ce que le Générateur de données CSV ?

Le Générateur de données CSV est un outil en ligne qui produit en lot des données de test structurées et les exporte en un fichier .csv standard. Pour chaque colonne, vous choisissez un type de donnée — nom, téléphone, carte d’identité, date, montant, UUID et plus —, fixez le nombre de lignes et obtenez des données fictives conformes aux règles. Vous pouvez aussi choisir le séparateur (virgule, point-virgule, tabulation ou barre verticale), décider d’inclure ou non une ligne d’en-tête, et ajouter un BOM UTF-8 pour qu’Excel ouvre le fichier sans caractères corrompus. Toutes les données sont générées localement dans votre navigateur et ne sont jamais envoyées à un serveur, ce qui en fait un choix idéal pour remplir des bases de données lors du développement et des tests, alimenter des interfaces de démonstration ou appuyer des cours et présentations. L’outil gère des données fictives localisées en dix langues : une fois la langue des données choisie, les champs nom, société, ville et téléphone sont générés selon les conventions réelles de la région — noms japonais pour le japonais, noms de sociétés coréens pour le coréen, etc.

Mode d’emploi

Étapes

  1. Choisissez une « Langue des données » en haut pour fixer le style des champs localisés comme nom et société
  2. Indiquez le nombre de lignes à générer ou choisissez un préréglage : 100 / 1K / 10K / 50K
  3. Sous « Options CSV », choisissez un séparateur, une fin de ligne, et indiquez s’il faut inclure une ligne d’en-tête et un BOM UTF-8
  4. Ajoutez les colonnes une à une sous « Définition des colonnes » : saisissez le nom, choisissez le type et renseignez les paramètres (plage numérique, plage de dates, etc.)
  5. Cliquez sur « Générer l’aperçu » pour vérifier les 10 premières lignes, puis sur « Exporter .csv » pour télécharger le fichier, ou sur « Copier le CSV » pour copier le texte directement

Astuces

  • Utilisez le type Enum avec des valeurs séparées par virgule pour des valeurs fixes comme sexe, statut ou niveau
  • Le type Regex génère des chaînes à partir d’un motif personnalisé et couvre ce que les types intégrés ne proposent pas
  • Choisissez le point-virgule ou la tabulation comme séparateur quand vos données contiennent des virgules, pour ne pas casser les champs
  • Activez le BOM UTF-8 si vous ouvrez le CSV dans Excel sous Windows, afin que le chinois et les autres caractères non ASCII s’affichent correctement
  • Utilisez « Copier le CSV » pour coller les données générées directement dans un tableur ou un éditeur sans passer par un fichier

Cas d’usage

Import et tests de bases de donnéesGénérez des lignes d’exemple et importez-les via des commandes LOAD DATA ou COPY pour vérifier types de champs, contraintes et performances des requêtes sans saisir de INSERT à la main.
Prototypes et démos d’interfaceExportez le CSV et glissez-le directement dans un tableur ou un outil de BI pour remplir prototypes, rapports et tableaux de bord de données réalistes, afin que les démos collent au vrai métier.
Tests de performance et de chargeGénérez d’un coup des dizaines de milliers de lignes en CSV et injectez-les via un endpoint d’import par lot pour mesurer le débit et la latence de la pagination, de l’export et des agrégations en volume réel.
Enseignement et formationPréparez instantanément des CSV d’exercice pour des cours d’import en base, d’analyse de données ou d’ETL, que les apprenants peuvent importer dans MySQL, Postgres ou Pandas pour passer tout de suite à la pratique.
Échange de données entre systèmesLe CSV est la langue véhiculaire universelle entre systèmes. Générez des fichiers CSV fictifs pour tester les pipelines d’import, les jobs ETL et les migrations de données entre plateformes différentes.

Principe technique

Le cœur de l’outil est un ensemble de générateurs répartis par type de colonne. Chaque colonne est liée à un type ; lors de la génération, chaque ligne est parcourue et la fonction génératrice correspondante est appelée, produisant un tableau bidimensionnel. Les types se divisent en deux groupes. Le premier regroupe les données fictives localisées, propulsées par les modules locale multilingues de @faker-js/faker : selon la langue choisie, il appelle les générateurs de nom, société, ville et téléphone propres à la région, de sorte que le japonais produit des noms japonais et le coréen des adresses coréennes. Le second regroupe les données formatées — nombres, dates, montants, UUID, IP, cartes d’identité — produites par des fonctions pures internes, où la carte d’identité chinoise suit la norme GB 11643 pour calculer la clé de contrôle à 18 chiffres. Contrairement à un format tableur, le CSV n’a pas de types de cellule : chaque valeur est du texte brut. Chaque valeur générée est donc sérialisée en une chaîne lisible — les dates en chaînes ISO (aaaa-mm-jj), les montants avec leur symbole monétaire, les booléens en true/false — puis le fichier est assemblé selon la RFC 4180 : tout champ contenant le séparateur, un guillemet double ou un saut de ligne est encadré par des guillemets doubles, et les guillemets doubles internes sont échappés en les doublant. Vous pouvez basculer le séparateur entre virgule, point-virgule, tabulation et barre verticale, choisir les fins de ligne CRLF ou LF, et ajouter facultativement un BOM UTF-8 pour qu’Excel détecte correctement l’encodage. Le module locale de faker pour la langue sélectionnée est chargé dynamiquement, n’important que celui nécessaire au lieu d’empaqueter les dix langues dans la page. Toute la génération et l’export se font localement dans le navigateur, sans aucun envoi. La source aléatoire est le générateur pseudo-aléatoire intégré du navigateur : les résultats d’une même exécution ne se répètent pas mais ne sont pas reproductibles ; pour des données reproductibles, vous pouvez fixer une graine (pris en charge dans une version future). Le plafond de 50 000 lignes équilibre consommation mémoire et temps d’export et couvre la grande majorité des besoins de test et de démo.

  • Répartition par type de colonne : données localisées via faker locale, données formatées via fonctions pures internes
  • faker locale est chargé dynamiquement, n’important que la langue courante pour maîtriser la taille du bundle
  • Le CSV suit la RFC 4180 : les champs avec séparateur, guillemet ou saut de ligne sont encadrés et les guillemets internes sont doublés
  • Le BOM UTF-8 facultatif permet à Excel d’ouvrir le fichier sans corrompre les caractères non ASCII
  • Tout s’exécute localement dans le navigateur — aucune donnée ne quitte votre appareil, protégeant la confidentialité

Exemples

Exemple de table utilisateurs

Colonnes :
  ID          -> Index auto. (début 1, pas 1)
  Nom         -> Nom complet
  E-mail      -> E-mail
  Téléphone   -> Téléphone
  Inscription -> Date et heure

Séparateur : virgule, en-tête : oui, BOM : oui
Lignes : 1000
Sortie : users.csv (1000 lignes)

Exemple de montants de commandes (séparateur point-virgule)

Colonnes :
  Commande -> UUID
  Montant  -> Montant (min 10, max 9999, 2 décimales)
  Remise   -> Pourcentage (min 0, max 50)
  Statut   -> Enum (en attente, payé, expédié, terminé)

Séparateur : point-virgule (les montants ne contiennent pas de virgule, mais le point-virgule évite les pièges de paramètres régionaux)
Sortie : orders.csv — à ouvrir dans Excel ou à importer directement dans une base de données.

FAQ

Les données générées sont-elles envoyées à un serveur ?

Non. Toutes les données sont générées et assemblées localement dans votre navigateur. L’outil n’envoie jamais vos définitions de colonnes, vos résultats ni le fichier CSV exporté à un serveur, ce qui le rend adapté aux schémas de table et dispositions de champs confidentiels.

Quel est le nombre maximum de lignes ?

Jusqu’à 50 000 lignes par exécution. Ce plafond équilibre la mémoire du navigateur avec le temps de construction du CSV et couvre la plupart des scénarios de test, de démo et d’import en base. Pour des volumes plus importants, générez par lots ou utilisez un script de base de données.

Pourquoi les champs nom et société nécessitent-ils une « Langue des données » ?

Les champs comme nom, entreprise, ville et téléphone sont fortement régionaux. Choisir une langue de données amène l’outil à les générer selon les conventions réelles de cette région — noms japonais pour le japonais, entreprises coréennes pour le coréen — pour que vos données de test du CSV collent au vrai métier.

Pourquoi les nombres et dates sont-ils du texte brut dans le CSV ?

Le CSV est un format purement textuel sans types de cellule, donc chaque valeur est stockée comme une chaîne. Nombres, montants, dates et autres sont sérialisés en texte lisible. Si vous avez besoin de types de cellule natifs qu’Excel peut calculer, utilisez plutôt le Générateur de données Excel.

Quand faut-il activer le BOM UTF-8 ?

Activez-le si vous ouvrez le CSV dans Excel sous Windows, surtout quand les données contiennent du chinois ou d’autres caractères non ASCII : le BOM indique à Excel de lire le fichier en UTF-8 et évite les caractères corrompus. La plupart des bases de données et outils de programmation gèrent l’UTF-8 sans BOM, vous pouvez donc le laisser désactivé pour eux.

Quel séparateur choisir ?

La virgule est la valeur par défaut et la plus largement compatible. Si vos données contiennent elles-mêmes des virgules (par exemple des adresses libres), passez au point-virgule, à la tabulation ou à la barre verticale pour ne pas scinder les champs. Certains paramètres régionaux européens utilisent la virgule comme séparateur décimal, auquel cas le point-virgule est la convention.

Comment générer un format que les types intégrés ne couvrent pas ?

Utilisez le type Regex pour générer des chaînes à partir d’un motif personnalisé. Par exemple, [A-Z]{3}\d{4} produit un code de trois majuscules suivies de quatre chiffres, couvrant avec souplesse ce que les types intégrés n’offrent pas.