CSV 資料產生器
依欄定義規則,批次產生結構化測試資料並匯出 .csv 檔案
欄定義
資料預覽
僅顯示前 10 列,匯出時產生全部列數
僅顯示前 10 列,匯出時產生全部列數
什麼是 CSV 資料產生器?
CSV 資料產生器是一款線上批次產生結構化測試資料的工具,可將結果匯出為標準 .csv 檔案。你只需為每一欄選擇一種資料類型——姓名、電話、身分證、日期、金額、UUID 等——設定產生列數,即可一鍵產出符合規則的模擬資料。你還能自訂分隔符(逗號、分號、Tab 或豎線)、是否包含表頭列,以及是否加上 UTF-8 BOM,讓 Excel 開啟時不出現亂碼。所有資料都在你的瀏覽器本地產生,不會上傳到任何伺服器,既適合開發與測試時填充資料庫、示範介面,也能用於教學與展示。工具支援十種語言的在地化假資料:選定資料語言後,姓名、公司、城市、電話等欄位會以對應語言地區的真實習慣格式產生,例如日語產生日本姓名、韓語產生韓國公司名。
使用方法
使用步驟
- 在頂部選擇「資料語言」,決定姓名、公司等在地化欄位的產生風格
- 設定需要產生的列數,或選擇快捷預設:100 / 1千 / 1萬 / 5萬
- 在「CSV 選項」中選擇分隔符、換行符,以及是否包含表頭列與 UTF-8 BOM
- 在「欄定義」中逐欄新增:填寫欄名、選擇資料類型、視需要填寫參數(如數字的範圍、日期的起訖)
- 點擊「產生預覽」查看前 10 列效果,再點擊「匯出 .csv」下載檔案,或用「複製 CSV」直接複製文字
使用技巧
- 列舉類型以逗號分隔多個候選項,適合產生性別、狀態、等級這類固定取值
- 正規表示式類型可依自訂規則產生字串,靈活覆蓋內建類型未提供的場景
- 當資料內容本身包含逗號時,改用分號或 Tab 作為分隔符,避免欄位被誤切
- 若要在 Windows 的 Excel 中開啟 CSV,建議開啟 UTF-8 BOM,讓中文等非 ASCII 文字正確顯示
- 用「複製 CSV」可直接把產生的資料貼進試算表或編輯器,不必先存檔
使用場景
技術原理
工具的核心是一套依欄類型分發的資料產生器。每欄綁定一個類型,產生時遍歷每一列呼叫對應類型的產生函式,產出一個二維陣列。類型分為兩類:一類是在地化假資料,借助 @faker-js/faker 的多語言 locale 模組,依選定的資料語言呼叫對應地區的姓名、公司、城市、電話等產生方法,因此日語得到日本姓名、韓語得到韓國地址;另一類是格式化資料,如數字、日期、金額、UUID、IP、身分證等,由工具自行實作的純函式產生,其中中文身分證依 GB 11643 標準計算 18 位號碼的檢查碼。 CSV 與試算表格式不同,沒有儲存格類型,每個值都是純文字。因此每個產生的值都會序列化為可讀字串——日期為 ISO 字串(yyyy-mm-dd)、金額帶貨幣符號、布林值為 true/false——再依 RFC 4180 組裝檔案:凡欄位內容包含分隔符、雙引號或換行符,就以外層雙引號包住,內部的雙引號則重複一次來轉義。你可以在逗號、分號、Tab、豎線之間切換分隔符,選擇 CRLF 或 LF 換行符,並選擇是否在檔首加上 UTF-8 BOM,讓 Excel 正確偵測編碼。 資料依選定語言對應的 faker locale 模組動態載入,只引入當前需要的那一份,避免把十種語言的資料全部打包進頁面。所有產生與匯出都在瀏覽器本地完成,不上傳任何資料。隨機來源使用瀏覽器內建的偽隨機數產生器,單次產生結果互不重複但不可重現;如需可重現的資料,可固定隨機種子(後續版本支援)。產生上限設為 5 萬列,是記憶體占用與匯出耗時的平衡點,足以涵蓋絕大多數測試與展示需求。
- 依欄類型分發:在地化資料走 faker locale,格式化資料走自實作純函式
- faker locale 動態載入,只引入當前語言,控制套件體積
- CSV 依循 RFC 4180:含分隔符、引號或換行符的欄位會加上引號,內部引號重複一次
- 可選的 UTF-8 BOM 讓 Excel 開啟時不出現非 ASCII 文字亂碼
- 全程瀏覽器本地處理,資料不外傳,保護隱私
範例
使用者表範例
欄定義:
ID -> 遞增序號(起始 1,步長 1)
姓名 -> 姓名
電子郵件 -> 電子郵件
手機號 -> 電話號碼
註冊時間 -> 日期時間
分隔符:逗號,表頭列:是,BOM:是
列數:1000
輸出:users.csv(1000 列)訂單金額範例(分號分隔)
欄定義:
訂單號 -> UUID
金額 -> 金額(最小 10,最大 9999,2 位小數)
折扣 -> 百分比(最小 0,最大 50)
狀態 -> 列舉(待付款,已付款,已出貨,已完成)
分隔符:分號(金額不含逗號,但用分號可避開地區設定陷阱)
輸出:orders.csv——可直接在 Excel 開啟或匯入資料庫。常見問題
產生的資料會上傳到伺服器嗎?
不會。所有資料都在你的瀏覽器本地產生與拼裝,工具不會把你的欄定義、產生結果或匯出的 CSV 檔案傳送到任何伺服器,適合處理需要保密的資料表結構與欄位佈局。
最多能產生多少列?
單次最多 50000 列。這是瀏覽器記憶體與 CSV 拼裝耗時的平衡點,足以涵蓋絕大多數測試、展示與資料庫匯入場景。如需更大量資料,建議分多次產生或改用資料庫指令稿。
為什麼姓名、公司等資料要選擇「資料語言」?
姓名、公司、城市、電話等欄位具有強烈的地區特徵。選定資料語言後,工具會依對應語言地區的真實習慣產生,例如選日語產生日本姓名、選韓語產生韓國公司名,使你的 CSV 測試資料更貼近真實業務。
為什麼 CSV 裡的數字和日期是純文字?
CSV 是純文字格式,沒有儲存格類型,每個值都以字串儲存。數字、金額、日期等都會序列化為可讀文字。若你需要 Excel 可計算的原生儲存格類型,請改用 Excel 資料產生器。
什麼時候要開啟 UTF-8 BOM?
若你要在 Windows 的 Excel 中開啟 CSV,尤其是資料包含中文或其他非 ASCII 字元時,建議開啟 BOM——它會告訴 Excel 以 UTF-8 讀取檔案,避免亂碼。多數資料庫與程式工具不加 BOM 也能正確處理 UTF-8,這類情境可以關閉。
分隔符該怎麼選?
逗號是預設值,相容性最高。若資料本身包含逗號(例如自由填寫的地址),可改用分號、Tab 或豎線,避免欄位被誤切。部分歐洲地區以逗號作為小數分隔符,此時慣例上會改用分號作為分隔符。
如何產生工具內建類型沒有的格式?
使用「正規表示式」類型,依自訂規則產生字串。例如 [A-Z]{3}\d{4} 可產生三位大寫字母加四位數字的編碼,靈活覆蓋內建類型未提供的場景。