Генератор данных CSV
Задайте правила для столбцов, массово генерируйте структурированные тестовые данные и экспортируйте .csv
Определение столбцов
Предпросмотр данных
Показаны только первые 10 строк; при экспорте генерируются все
Показаны только первые 10 строк; при экспорте генерируются все
Что такое Генератор данных CSV?
Генератор данных CSV — это онлайн-инструмент для массовой генерации структурированных тестовых данных и экспорта их в стандартный файл .csv. Для каждого столбца вы выбираете тип данных — имя, телефон, удостоверение, дата, деньги, UUID и др. — задаете число строк и получаете фиктивные данные по правилам. Также можно выбрать разделитель (запятая, точка с запятой, табуляция или вертикальная черта), включать ли строку заголовка и добавлять ли UTF-8 BOM, чтобы Excel открывал файл без искажений. Все данные генерируются локально в вашем браузере и никогда не загружаются на сервер, что идеально для наполнения баз данных при разработке и тестировании, оживления демо-интерфейсов или поддержки занятий и презентаций. Инструмент поддерживает локализованные фиктивные данные на десяти языках: после выбора языка данных поля имени, компании, города и телефона генерируются по реальным правилам этого региона — японские имена для японского, корейские компании для корейского и т. д.
Как использовать
Шаги
- Выберите «Язык данных» вверху, чтобы задать стиль локализованных полей вроде имени и компании
- Укажите число строк для генерации или выберите быстрый пресет: 100 / 1К / 10К / 50К
- В «Параметрах CSV» выберите разделитель, конец строки, а также включать ли строку заголовка и UTF-8 BOM
- Добавляйте столбцы по одному в «Определении столбцов»: введите имя, выберите тип данных и при необходимости параметры (диапазон чисел, диапазон дат)
- Нажмите «Сгенерировать превью» для проверки первых 10 строк, затем «Экспорт .csv» для скачивания файла или «Скопировать CSV» для копирования текста напрямую
Советы
- Тип Enum со значениями через запятую подходит для фиксированных величин вроде пола, статуса или уровня
- Тип Regex генерирует строки по пользовательскому шаблону и покрывает случаи, которых нет во встроенных типах
- Выберите точку с запятой или табуляцию в качестве разделителя, если данные содержат запятые, чтобы не ломать поля
- Включите UTF-8 BOM, если планируете открывать CSV в Excel на Windows, чтобы китайские и другие не-ASCII символы отображались корректно
- Используйте «Скопировать CSV», чтобы вставить сгенерированные данные прямо в таблицу или редактор без сохранения файла
Сценарии использования
Технический принцип
Ядро инструмента — набор генераторов, распределенных по типу столбца. Каждый столбец привязан к типу; при генерации обходится каждая строка и вызывается соответствующая функция-генератор, что дает двумерный массив. Типы делятся на две группы. Первая — локализованные фиктивные данные на базе многоязычных locale-модулей @faker-js/faker: по выбранному языку вызываются генераторы имени, компании, города и телефона, характерные для региона, поэтому японский дает японские имена, а корейский — корейские адреса. Вторая — форматированные данные: числа, даты, деньги, UUID, IP, удостоверения и прочее, создаваемые собственными чистыми функциями, где китайское удостоверение формируется по стандарту GB 11643 с вычислением 18-значной контрольной цифры. В отличие от табличного формата, в CSV нет типов ячеек: каждое значение — обычный текст. Поэтому каждое сгенерированное значение сериализуется в читаемую строку — даты в виде ISO (yyyy-mm-dd), деньги с символом валюты, логические как true/false — после чего файл собирается по RFC 4180: любое поле, содержащее разделитель, двойную кавычку или перенос строки, заключается в двойные кавычки, а внутренние кавычки дублируются. Разделитель можно переключать между запятой, точкой с запятой, табуляцией и вертикальной чертой, выбирать конец строки CRLF или LF и при необходимости добавлять UTF-8 BOM, чтобы Excel корректно определял кодировку. Locale-модуль faker для выбранного языка загружается динамически: импортируется только нужный сейчас, а не все десять языков в страницу. Вся генерация и экспорт происходят локально в браузере без загрузок. Источник случайности — встроенный генератор псевдослучайных чисел браузера: результаты в рамках одного запуска не повторяются, но не воспроизводимы; для воспроизводимых данных можно зафиксировать seed (поддержка в будущей версии). Лимит в 50 000 строк балансирует потребление памяти и время экспорта и покрывает подавляющее большинство нужд тестирования и демо.
- Диспетчеризация по типу столбца: локализованные данные через faker locale, форматированные — через собственные чистые функции
- faker locale загружается динамически, импортируя только текущий язык для контроля размера бандла
- CSV следует RFC 4180: поля с разделителями, кавычками или переносами строк заключаются в кавычки, а внутренние кавычки дублируются
- Необязательный UTF-8 BOM позволяет Excel открыть файл без искажений не-ASCII текста
- Всё выполняется локально в браузере — данные не покидают устройство, защищая конфиденциальность
Примеры
Пример таблицы пользователей
Столбцы:
ID -> Авто-индекс (начало 1, шаг 1)
Имя -> Полное имя
Email -> Email
Телефон -> Телефон
Регистрация -> Дата и время
Разделитель: запятая, заголовок: да, BOM: да
Строк: 1000
Результат: users.csv (1000 строк)Пример сумм заказов (разделитель — точка с запятой)
Столбцы:
Заказ -> UUID
Сумма -> Деньги (мин 10, макс 9999, 2 знака)
Скидка -> Процент (мин 0, макс 50)
Статус -> Enum (ожидает, оплачен, отгружен, завершён)
Разделитель: точка с запятой (в суммах нет запятой, но точка с запятой избегает ловушек локали)
Результат: orders.csv — открывайте в Excel или импортируйте в базу данных напрямую.Частые вопросы
Загружаются ли сгенерированные данные на сервер?
Нет. Все данные генерируются и собираются локально в вашем браузере. Инструмент никогда не отправляет ваши определения столбцов, результаты или экспортированный файл CSV на сервер, что подходит для конфиденциальных схем таблиц и структуры полей.
Какое максимальное число строк?
До 50 000 строк за один запуск. Это баланс между памятью браузера и временем сборки CSV, покрывающий большинство сценариев тестирования, демонстрации и импорта в базу данных. Для больших объёмов генерируйте пакетами или используйте скрипт базы данных.
Почему поля имени и компании требуют «Язык данных»?
Поля вроде имени, компании, города и телефона сильно зависят от региона. Выбор языка данных заставляет инструмент генерировать их по реальным правилам этого региона — японские имена для японского, корейские компании для корейского — чтобы ваши тестовые данные CSV были ближе к реальному бизнесу.
Почему числа и даты в CSV — обычный текст?
CSV — это чисто текстовый формат без типов ячеек, поэтому каждое значение хранится как строка. Числа, деньги, даты и тому подобное сериализуются в читаемый текст. Если нужны нативные типы ячеек, которые Excel может вычислять, используйте Генератор данных Excel.
Когда нужно включать UTF-8 BOM?
Включайте, если планируете открывать CSV в Excel на Windows, особенно когда данные содержат китайские или другие не-ASCII символы — BOM дает Excel понять, что файл в UTF-8, и избавляет от искажений. Большинство баз данных и инструментов программирования корректно работают с UTF-8 и без BOM, поэтому для них его можно не добавлять.
Какой разделитель выбрать?
По умолчанию используется запятая — она наиболее совместима. Если сами данные содержат запятые (например, свободные адреса), переключитесь на точку с запятой, табуляцию или вертикальную черту, чтобы не разрывать поля. В некоторых европейских локалях запятая служит десятичным разделителем, и тогда точка с запятой в качестве разделителя полей — общепринятое соглашение.
Как сгенерировать формат, не покрытый встроенными типами?
Используйте тип Regex для генерации строк по пользовательскому шаблону. Например, [A-Z]{3}\d{4} создает код из трех заглавных букв и четырех цифр, гибко покрывая случаи, которых нет во встроенных типах.