Token 計算器
估算文本在 AI 模型中的 Token 數量,支援主流大模型定價計算
輸入文本
統計結果
Token 數量0
字符數0
中文字數0
單詞數(估算)0
字符/Token 比值0
預估成本
輸入 Token0
輸出 Token1,000
總成本$0.0100
$2.50 / 1M Token 輸入
$10.00 / 1M Token 輸出
什麼是 Token?
Token 是 AI 模型處理文本的基本單位。模型將文本切分成更小的片段(Token),每個 Token 可能是一個字符、一個單詞的一部分,或者一個完整的單詞。
不同模型使用不同的分詞算法。DeepSeek 等國產模型對中文有更好的優化。
使用方法
基本操作
- 在左側文本框中輸入或貼上需要計算的文本
- 選擇目標 AI 模型(如 GPT-4、Claude、Gemini 等)
- 右側面板會顯示 Token 數量估算結果
- 可以設置預估輸出長度,計算 API 調用成本
分詞規則說明
- GPT 系列:英文約 4 字符 = 1 Token,中文約 1.5 字符 = 1 Token
- Claude 系列:分詞規則與 GPT 類似,但略有差異
- DeepSeek 系列:針對中文優化,中文約 2 字符 = 1 Token
- 特殊字符、標點符號、換行等也會消耗 Token
- 代碼、JSON 等結構化文本的 Token 密度通常更高
常見問題 (FAQ)
Q: 為什麼估算結果和 API 實際返回不同?
A: 本工具使用近似算法估算 Token 數量。建議將估算值作為參考,實際 Token 數以 API 返回的 usage 字段為準。
Q: 中文和英文的 Token 計算有什麼區別?
A: 英文單詞平均約 4 個字符對應 1 個 Token,中文在不同模型中差異較大:GPT 約 1.5 字符/Token,DeepSeek 約 2 字符/Token。
Q: 如何減少 Token 消耗?
A: 可以通過精簡 Prompt、移除冗餘信息、使用更簡潔的表達方式來減少 Token。選擇中文優化模型也能提高效率。
Q: Token 和字符數的關係是什麼?
A: Token 和字符數沒有固定的轉換關係。英文文本的字符/Token 比值通常在 3-5 之間,中文在 GPT 中通常在 0.5-1.5 之間。
Q: 不同模型的 Token 計算方式一樣嗎?
A: 不一樣。每個模型有自己的分詞器和詞彙表。GPT-4、Claude、Gemini 使用完全不同的分詞算法,DeepSeek 對中文有特別優化。