ToolActToolAct

Gerador de dados CSV

Defina colunas por regra, gere dados de teste estruturados em lote e exporte um arquivo .csv

Até 50.000 linhas

Definição de colunas

Prévia dos dados

Apenas as 10 primeiras linhas são exibidas; a exportação gera todas

Apenas as 10 primeiras linhas são exibidas; a exportação gera todas

O que é o Gerador de dados CSV?

O Gerador de dados CSV é uma ferramenta online para gerar em lote dados de teste estruturados e exportá-los como um arquivo .csv padrão. Para cada coluna você escolhe um tipo de dado — nome, telefone, documento, data, dinheiro, UUID e mais —, define o número de linhas e obtém dados fictícios conforme as regras. Você também pode escolher o delimitador (vírgula, ponto e vírgula, tabulação ou pipe), se incluirá uma linha de cabeçalho e se adicionará um BOM UTF-8 para o Excel abrir o arquivo sem caracteres corrompidos. Todos os dados são gerados localmente no seu navegador e nunca enviados a um servidor, o que o torna ideal para preencher bancos de dados em desenvolvimento e testes, alimentar interfaces de demonstração ou apoiar aulas e apresentações. A ferramenta suporta dados fictícios localizados em dez idiomas: ao escolher um idioma de dados, campos como nome, empresa, cidade e telefone são gerados nas convenções reais daquela região — nomes japoneses para japonês, empresas coreanas para coreano e assim por diante.

Como usar

Passos

  1. Escolha um "Idioma dos dados" no topo para definir o estilo de campos localizados como nome e empresa
  2. Indique o número de linhas a gerar ou escolha um preset rápido: 100 / 1K / 10K / 50K
  3. Em "Opções CSV" escolha o delimitador, o fim de linha e se incluirá uma linha de cabeçalho e um BOM UTF-8
  4. Adicione colunas uma a uma em "Definição de colunas": informe o nome, escolha o tipo e preencha parâmetros quando necessário (faixa numérica, intervalo de datas)
  5. Clique em "Gerar prévia" para conferir as 10 primeiras linhas e depois em "Exportar .csv" para baixar o arquivo, ou em "Copiar CSV" para copiar o texto diretamente

Dicas

  • Use o tipo Enum com valores separados por vírgula para opções fixas como gênero, status ou nível
  • O tipo Regex gera strings a partir de um padrão personalizado e cobre o que os tipos integrados não oferecem
  • Escolha ponto e vírgula ou tabulação como delimitador quando seus dados contiverem vírgulas, para não quebrar campos
  • Ative o BOM UTF-8 se você vai abrir o CSV no Excel no Windows, para que caracteres chineses e outros não-ASCII apareçam corretamente
  • Use "Copiar CSV" para colar os dados gerados direto em uma planilha ou editor, sem salvar arquivo

Casos de uso

Importação e testes de banco de dadosGere linhas de exemplo e importe-as via comandos LOAD DATA ou COPY para verificar tipos, restrições e desempenho de consultas sem digitar INSERT à mão.
Protótipos e demos de interfaceExporte o CSV e arraste-o direto para uma planilha ou ferramenta de BI para preencher protótipos, relatórios e painéis com dados realistas que aproximem as demos do negócio real.
Testes de performance e cargaGere de uma vez dezenas de milhares de linhas em CSV e carregue-as via um endpoint de importação em lote para medir a vazão e a latência de paginação, exportação e agregações em volume real.
Ensino e treinamentoPrepare na hora CSVs de exercício para aulas de importação em banco de dados, análise de dados ou ETL, que os alunos podem importar para MySQL, Postgres ou Pandas e praticar imediatamente.
Troca de dados entre sistemasCSV é a linguagem universal entre sistemas. Gere arquivos CSV fictícios para testar pipelines de importação, jobs de ETL e migrações de dados entre plataformas diferentes.

Princípio técnico

O núcleo da ferramenta é um conjunto de geradores distribuídos por tipo de coluna. Cada coluna é vinculada a um tipo; durante a geração, cada linha é percorrida e a função geradora correspondente é chamada, produzindo um array bidimensional. Os tipos dividem-se em dois grupos. O primeiro são dados fictícios localizados, impulsionados pelos módulos locale multilíngues de @faker-js/faker: conforme o idioma escolhido, são chamados os geradores de nome, empresa, cidade e telefone próprios da região, de modo que o japonês produz nomes japoneses e o coreano produz endereços coreanos. O segundo são dados formatados — números, datas, dinheiro, UUID, IP, documentos e similares — gerados por funções puras próprias, em que o documento chinês segue a norma GB 11643 para calcular o dígito verificador de 18 dígitos. Diferente de um formato de planilha, o CSV não tem tipos de célula: cada valor é texto puro. Por isso cada valor gerado é serializado em uma string legível — datas como strings ISO (aaaa-mm-dd), dinheiro com seu símbolo de moeda, booleanos como true/false — e o arquivo é então montado segundo a RFC 4180: qualquer campo que contenha o delimitador, uma aspa dupla ou uma quebra de linha é envolto por aspas duplas, e as aspas duplas internas são escapadas duplicando-as. Você pode alternar o delimitador entre vírgula, ponto e vírgula, tabulação e pipe, escolher fins de linha CRLF ou LF e, opcionalmente, prefixar um BOM UTF-8 para que o Excel detecte a codificação corretamente. O módulo locale do faker para o idioma selecionado é carregado dinamicamente, importando apenas o necessário em vez de empacotar os dez idiomas na página. Toda a geração e exportação acontecem localmente no navegador, sem upload. A fonte de aleatoriedade é o gerador pseudoaleatório embutido do navegador: os resultados de uma execução não se repetem, mas não são reproduzíveis; para dados reproduzíveis você pode fixar uma semente (suportado em uma versão futura). O limite de 50.000 linhas equilibra uso de memória e tempo de exportação e cobre a grande maioria das necessidades de teste e demo.

  • Distribuição por tipo de coluna: dados localizados via faker locale, dados formatados via funções puras próprias
  • faker locale é carregado dinamicamente, importando apenas o idioma atual para controlar o tamanho do bundle
  • O CSV segue a RFC 4180: campos com delimitadores, aspas ou quebras de linha são colocados entre aspas e as aspas internas são duplicadas
  • O BOM UTF-8 opcional permite que o Excel abra o arquivo sem corromper texto não-ASCII
  • Tudo roda localmente no navegador — nenhum dado sai do seu dispositivo, protegendo a privacidade

Exemplos

Exemplo de tabela de usuários

Colunas:
  ID          -> Índice auto. (início 1, passo 1)
  Nome        -> Nome completo
  E-mail      -> E-mail
  Telefone    -> Telefone
  Cadastro    -> Data e hora

Delimitador: vírgula, cabeçalho: sim, BOM: sim
Linhas: 1000
Saída: users.csv (1000 linhas)

Exemplo de valores de pedidos (delimitador ponto e vírgula)

Colunas:
  Pedido  -> UUID
  Valor   -> Dinheiro (mín 10, máx 9999, 2 decimais)
  Desconto -> Percentual (mín 0, máx 50)
  Status  -> Enum (pendente, pago, enviado, concluído)

Delimitador: ponto e vírgula (os valores não contêm vírgula, mas o ponto e vírgula evita armadilhas de locale)
Saída: orders.csv — abra no Excel ou importe diretamente em um banco de dados.

Perguntas frequentes

Os dados gerados são enviados a um servidor?

Não. Todos os dados são gerados e montados localmente no seu navegador. A ferramenta nunca envia suas definições de colunas, os resultados nem o arquivo CSV exportado para nenhum servidor, o que a torna adequada para esquemas de tabela e disposições de campos confidenciais.

Qual o número máximo de linhas?

Até 50.000 linhas por execução. Isso equilibra a memória do navegador com o tempo de montagem do CSV e cobre a maioria dos cenários de teste, demo e importação em banco de dados. Para volumes maiores, gere em lotes ou use um script de banco de dados.

Por que os campos de nome e empresa precisam de um "Idioma dos dados"?

Campos como nome, empresa, cidade e telefone são fortemente regionais. Escolher um idioma de dados faz a ferramenta gerá-los segundo as convenções reais daquela região — nomes japoneses para japonês, empresas coreanas para coreano — para que seus dados de teste do CSV fiquem próximos do negócio real.

Por que números e datas são texto puro no CSV?

CSV é um formato exclusivamente textual, sem tipos de célula, então cada valor é armazenado como string. Números, dinheiro, datas e afins são serializados em texto legível. Se você precisa de tipos de célula nativos que o Excel consiga calcular, use o Gerador de dados Excel.

Quando devo ativar o BOM UTF-8?

Ative se você vai abrir o CSV no Excel no Windows, especialmente quando os dados contêm caracteres chineses ou outros não-ASCII — o BOM diz ao Excel para ler o arquivo como UTF-8 e evita texto corrompido. A maioria dos bancos de dados e ferramentas de programação lida com UTF-8 bem sem BOM, então pode deixá-lo desligado nesses casos.

Qual delimitador devo escolher?

A vírgula é o padrão e a mais compatível. Se seus dados em si contêm vírgulas (por exemplo, endereços livres), troque para ponto e vírgula, tabulação ou pipe para não dividir campos. Alguns locales europeus usam vírgula como separador decimal, caso em que o ponto e vírgula é a convenção.

Como gero um formato que os tipos integrados não cobrem?

Use o tipo Regex para gerar strings a partir de um padrão personalizado. Por exemplo, [A-Z]{3}\d{4} produz um código de três maiúsculas seguidas de quatro dígitos, cobrindo com flexibilidade o que os tipos integrados não oferecem.