ToolAct工具行動

CSV 資料產生器

依欄定義規則,批次產生結構化測試資料並匯出 .csv 檔案

最多 50000 列

欄定義

資料預覽

僅顯示前 10 列,匯出時產生全部列數

僅顯示前 10 列,匯出時產生全部列數

什麼是 CSV 資料產生器?

CSV 資料產生器是一款線上批次產生結構化測試資料的工具,可將結果匯出為標準 .csv 檔案。你只需為每一欄選擇一種資料類型——姓名、電話、身分證、日期、金額、UUID 等——設定產生列數,即可一鍵產出符合規則的模擬資料。你還能自訂分隔符(逗號、分號、Tab 或豎線)、是否包含表頭列,以及是否加上 UTF-8 BOM,讓 Excel 開啟時不出現亂碼。所有資料都在你的瀏覽器本地產生,不會上傳到任何伺服器,既適合開發與測試時填充資料庫、示範介面,也能用於教學與展示。工具支援十種語言的在地化假資料:選定資料語言後,姓名、公司、城市、電話等欄位會以對應語言地區的真實習慣格式產生,例如日語產生日本姓名、韓語產生韓國公司名。

使用方法

使用步驟

  1. 在頂部選擇「資料語言」,決定姓名、公司等在地化欄位的產生風格
  2. 設定需要產生的列數,或選擇快捷預設:100 / 1千 / 1萬 / 5萬
  3. 在「CSV 選項」中選擇分隔符、換行符,以及是否包含表頭列與 UTF-8 BOM
  4. 在「欄定義」中逐欄新增:填寫欄名、選擇資料類型、視需要填寫參數(如數字的範圍、日期的起訖)
  5. 點擊「產生預覽」查看前 10 列效果,再點擊「匯出 .csv」下載檔案,或用「複製 CSV」直接複製文字

使用技巧

  • 列舉類型以逗號分隔多個候選項,適合產生性別、狀態、等級這類固定取值
  • 正規表示式類型可依自訂規則產生字串,靈活覆蓋內建類型未提供的場景
  • 當資料內容本身包含逗號時,改用分號或 Tab 作為分隔符,避免欄位被誤切
  • 若要在 Windows 的 Excel 中開啟 CSV,建議開啟 UTF-8 BOM,讓中文等非 ASCII 文字正確顯示
  • 用「複製 CSV」可直接把產生的資料貼進試算表或編輯器,不必先存檔

使用場景

資料庫匯入與測試產生一批樣本列,透過 LOAD DATA 或 COPY 指令匯入,驗證欄位類型、條件約束與查詢效能,無需手打 INSERT。
介面原型與展示匯出 CSV 後直接拖入試算表軟體或 BI 工具,為產品原型、報表、大螢幕填充逼真資料,讓展示效果更接近真實業務。
效能與壓力測試一次產生數萬列 CSV,搭配批次匯入介面灌入系統,測試分頁、匯出、聚合查詢在真實資料量下的吞吐與耗時。
教學與培訓在資料庫匯入、資料分析、ETL 課程中快速準備練習用 CSV,學員可直接匯入 MySQL、Postgres 或 Pandas 上手操作。
跨系統資料交換CSV 是系統之間通用的共通語言。產生模擬 CSV 檔案,用於測試跨平台的匯入流程、ETL 任務與資料遷移。

技術原理

工具的核心是一套依欄類型分發的資料產生器。每欄綁定一個類型,產生時遍歷每一列呼叫對應類型的產生函式,產出一個二維陣列。類型分為兩類:一類是在地化假資料,借助 @faker-js/faker 的多語言 locale 模組,依選定的資料語言呼叫對應地區的姓名、公司、城市、電話等產生方法,因此日語得到日本姓名、韓語得到韓國地址;另一類是格式化資料,如數字、日期、金額、UUID、IP、身分證等,由工具自行實作的純函式產生,其中中文身分證依 GB 11643 標準計算 18 位號碼的檢查碼。 CSV 與試算表格式不同,沒有儲存格類型,每個值都是純文字。因此每個產生的值都會序列化為可讀字串——日期為 ISO 字串(yyyy-mm-dd)、金額帶貨幣符號、布林值為 true/false——再依 RFC 4180 組裝檔案:凡欄位內容包含分隔符、雙引號或換行符,就以外層雙引號包住,內部的雙引號則重複一次來轉義。你可以在逗號、分號、Tab、豎線之間切換分隔符,選擇 CRLF 或 LF 換行符,並選擇是否在檔首加上 UTF-8 BOM,讓 Excel 正確偵測編碼。 資料依選定語言對應的 faker locale 模組動態載入,只引入當前需要的那一份,避免把十種語言的資料全部打包進頁面。所有產生與匯出都在瀏覽器本地完成,不上傳任何資料。隨機來源使用瀏覽器內建的偽隨機數產生器,單次產生結果互不重複但不可重現;如需可重現的資料,可固定隨機種子(後續版本支援)。產生上限設為 5 萬列,是記憶體占用與匯出耗時的平衡點,足以涵蓋絕大多數測試與展示需求。

  • 依欄類型分發:在地化資料走 faker locale,格式化資料走自實作純函式
  • faker locale 動態載入,只引入當前語言,控制套件體積
  • CSV 依循 RFC 4180:含分隔符、引號或換行符的欄位會加上引號,內部引號重複一次
  • 可選的 UTF-8 BOM 讓 Excel 開啟時不出現非 ASCII 文字亂碼
  • 全程瀏覽器本地處理,資料不外傳,保護隱私

範例

使用者表範例

欄定義:
  ID        -> 遞增序號(起始 1,步長 1)
  姓名      -> 姓名
  電子郵件  -> 電子郵件
  手機號    -> 電話號碼
  註冊時間  -> 日期時間

分隔符:逗號,表頭列:是,BOM:是
列數:1000
輸出:users.csv(1000 列)

訂單金額範例(分號分隔)

欄定義:
  訂單號  -> UUID
  金額    -> 金額(最小 10,最大 9999,2 位小數)
  折扣    -> 百分比(最小 0,最大 50)
  狀態    -> 列舉(待付款,已付款,已出貨,已完成)

分隔符:分號(金額不含逗號,但用分號可避開地區設定陷阱)
輸出:orders.csv——可直接在 Excel 開啟或匯入資料庫。

常見問題

產生的資料會上傳到伺服器嗎?

不會。所有資料都在你的瀏覽器本地產生與拼裝,工具不會把你的欄定義、產生結果或匯出的 CSV 檔案傳送到任何伺服器,適合處理需要保密的資料表結構與欄位佈局。

最多能產生多少列?

單次最多 50000 列。這是瀏覽器記憶體與 CSV 拼裝耗時的平衡點,足以涵蓋絕大多數測試、展示與資料庫匯入場景。如需更大量資料,建議分多次產生或改用資料庫指令稿。

為什麼姓名、公司等資料要選擇「資料語言」?

姓名、公司、城市、電話等欄位具有強烈的地區特徵。選定資料語言後,工具會依對應語言地區的真實習慣產生,例如選日語產生日本姓名、選韓語產生韓國公司名,使你的 CSV 測試資料更貼近真實業務。

為什麼 CSV 裡的數字和日期是純文字?

CSV 是純文字格式,沒有儲存格類型,每個值都以字串儲存。數字、金額、日期等都會序列化為可讀文字。若你需要 Excel 可計算的原生儲存格類型,請改用 Excel 資料產生器。

什麼時候要開啟 UTF-8 BOM?

若你要在 Windows 的 Excel 中開啟 CSV,尤其是資料包含中文或其他非 ASCII 字元時,建議開啟 BOM——它會告訴 Excel 以 UTF-8 讀取檔案,避免亂碼。多數資料庫與程式工具不加 BOM 也能正確處理 UTF-8,這類情境可以關閉。

分隔符該怎麼選?

逗號是預設值,相容性最高。若資料本身包含逗號(例如自由填寫的地址),可改用分號、Tab 或豎線,避免欄位被誤切。部分歐洲地區以逗號作為小數分隔符,此時慣例上會改用分號作為分隔符。

如何產生工具內建類型沒有的格式?

使用「正規表示式」類型,依自訂規則產生字串。例如 [A-Z]{3}\d{4} 可產生三位大寫字母加四位數字的編碼,靈活覆蓋內建類型未提供的場景。