簡体字・繁体字変換ツール
簡体字中国語と繁体字中国語の相互変換、台湾・香港標準対応
簡体字・繁体字変換とは?
簡体字・繁体字変換は、簡体字中国語と繁体字中国語間の相互変換を指します。中国本土は簡体字中国語を使用し、台湾、香港、マカオ、海外華人社会の多くは繁体字中国語を使用しています。
本ツールは複数の変換標準に対応:簡体字→繁体字、繁体字→簡体字、および台湾・香港地域向けのローカライズ変換(地域による用語差を考慮)。
正式な用途では、元の単位、丸め規則、必要な精度を明確に記録しておく必要があります。
使い方
使い方
- 左側の入力ボックスに中国語のテキストを貼り付けるか入力してください
- 下のボタンから変換方法を選択してください(簡体字→繁体字、繁体字→簡体字、台湾繁体字、香港繁体字)
- 変換されたテキストは右側の出力ボックスに自動的に表示されます
- 「コピー」で結果を保存、「入れ替え」で変換方向を反転できます
ローカライズのヒント
- 文字変換は完全なローカライズと同じではありません。地域ごとの語彙、句読点、製品用語は手動での確認が必要になる場合があります。
- 法的文書、医療関連、ブランド、公開向けのコピーについては、対象地域のネイティブスピーカーに変換結果の確認を依頼してください。
利用シーン
仕組み
変換は単純な一文字ずつの置換ではなく、OpenCC(Open Chinese Convert)の辞書ファイルによって駆動されます。OpenCCは変換方向ごとに別々の辞書を同梱しており、s2t(簡体字→繁体字)、t2s(繁体字→簡体字)、s2tw(簡体字→台湾正体)、s2hk(簡体字→香港繁体字)、s2twp(簡体字→台湾正体+フレーズ変換)、tw2sp(台湾正体→簡体字+フレーズ)が用意されています。これらの辞書は事前にコンパイルされたtrie構造から最長一致フレーズを優先する最大前方一致分割を適用します。そのため、簡体字の「后」一字でも、周囲の単語に応じて「后」(皇后、そのまま保持)と「後」(後ろ・以降、マッピング先)に正しく分岐します。「皇后」はフレーズ辞書が文字辞書より先にマッチするからです。 文字データはCJK統合漢字ブロックU+4E00~U+9FFFに格納され、拡張A(U+3400~U+4DBF)と拡張B(U+20000~U+2A6DF)でより稀な字体をカバーしています。JavaScriptの文字列はUTF-16であるため、拡張Bの文字はサロゲートペア(2つのコードユニット)を占め、変換では.charAtインデックスではなくコードポイント単位でイテレートし、サロゲートの分割を回避する必要があります。地域差は辞書の連鎖で処理されます。s2twは基本のs2t変換を実行した後、台湾特有の語彙置換(例:软件→軟體、网络→網路、内存→記憶體)を適用し、s2hkは「軟件」を保持し「視像」を「視頻」より優先する香港用テーブルを適用します。フレーズテーブルは、1956年の中国における漢字簡素化方案以降、台湾の教育部推薦や香港教育局リストに至るまで続く文化的分岐を符号化しています。 完全な可逆往復変換は保証されません。簡体字の「干」は「干」(乾く・幹)、「乾」(乾く)、「幹」(する・幹)を統合しているため、s2t→t2sの往復で「乾」を含む文は「干」に戻り、新しい文脈で別の繁体字に再展開される可能性があります。句読点変換(半角「」から全角引用符、または中国本土の「」対台湾の『』のネスト)は別辞書パスであり、すべてのエンジンがデフォルトで有効にしているわけではありません。OpenCCの出力は地域向けコピーの高品質な下書きとして扱い、ブランド名、固有名詞、新しく作られた技術用語については対象市場の実際の用法に照らして人間による確認が必要です。
- 事前コンパイルされたフレーズtrie構造に対する最大前方一致分割であり、無闇な文字置換ではない。
- ソース範囲はCJK統合漢字U+4E00~U+9FFF。拡張B(U+20000以降)はUTF-16サロゲートペアとして符号化される。
- 一対多マッピング(后/後/后、干/乾/幹/榦、发/發/髮)はフレーズ文脈で解決され、文字単独では決まらない。
- バリアント連鎖:s2twではs2t→TWVariants、s2hkではs2t→HKVariants、オプションのフレーズテーブル(s2twp)付き。
- 変換は常に可逆とは限らない。s2t→t2sの往復で統合された簡体字が別の繁体字に崩れる場合がある。
- Unicodeコードポイント単位でイテレート(for..ofまたはArray.from)し、サロゲートペアの文字を分割しない。
- 句読点変換(引用符スタイルなど)は別辞書にあり、明示的に切り替える必要がある。
使用例
簡体字 → 繁体字 (基本語彙)
入力 : 学习中文很有趣,我喜欢看电视和听音乐。
出力 : 學習中文很有趣,我喜歡看電視和聽音樂。
備考 : OpenCC s2t による標準的な 1 文字対応の変換繁体字 → 簡体字
入力 : 請打開電腦,然後啟動瀏覽器。
出力 : 请打开电脑,然后启动浏览器。
備考 : 台湾・香港の記事を中国本土の読者向けに移植する用途に便利簡体字 → 台湾繁体字 (語彙変換あり)
入力 : 这个软件的网络连接出现问题,请检查内存。
出力 : 這個軟體的網路連線出現問題,請檢查記憶體。
備考 : 软件->軟體、网络->網路、连接->連線、内存->記憶體 (台湾でのローカル用語)簡体字 → 香港繁体字 (香港用語)
入力 : 这个软件支持视频通话和打印功能。
出力 : 這個軟件支援視像通話和打印功能。
備考 : 软件->軟件 (香港では 軟件 のまま)、视频->視像 (香港の慣用語)1 対多の文字: 后 と 後
入力 : 皇后走在皇帝的后面。
出力 : 皇后走在皇帝的後面。
解説 : 皇后 (皇帝の妻) は 后 のまま、后面 (後ろ) は 後面 に変換されるよくある質問
簡体字と繁体字の違いは何ですか?
簡体字(简体)は中国本土とシンガポールで使用されており、1950年代から体系的に簡略化された文字です(例:龍 → 龙)。繁体字(繁體)は台湾と香港で使用されており、古い字形を保持しています。両方で同じに見える文字もあります。
台湾と香港の繁体字は同じですか?
ほぼ同じですが、常にそうとは限りません。台湾は「國字標準字體」を使用し、香港は「常用字字形表」を使用しています。裡/裏、麼/麽、著/着など、数百字で違いがあるため、ネイティブの読者向けには適切な地域を選ぶことが重要です。
変換で単語の境界は保持されますか?
文字単位の変換では元の間隔が完全に保持されます。さらにフレーズレベルの辞書も適用されるため、計算機 ↔ 計算機/电脑、软件 ↔ 軟體といった海峡を挟んだ用語の違いも、視覚的な字形だけでなく正しく処理されます。
変換は可逆ですか?
簡体字から繁体字への変換は時に曖昧です。一つの簡体字が複数の繁体字に対応する場合があるためです(例:后は后(皇后)または後(あと)に対応)。ページでは文脈ヒューリスティックを使用しますが、すべての単語で正しさを保証することはできません。重要なテキストは必ず確認してください。
縦書きや句読点には対応していますか?
句読点は変換されます(, ↔ ,;。↔ 。は同じですが、引用符「」/“”/'' は地域によって切り替わります)。縦書きレイアウトは表示の問題であり変換の問題ではないため、結果をコピーして縦書きレイアウトのコンテナに貼り付けてください。
なぜ「電話」が時々電話に変換され、時々電話に変換されるのですか?
両者は同じ文字列です。一部のアプリケーションでは、視覚的に同一な文字に対してわずかに異なるコードポイント(互換性異体字)を使用しています。出力は選択された地域の標準形を使用します。下流のツールが「間違っている」と判定する場合、そのツールが非標準の異体字と比較していることになります。
テキストはアップロードされますか?
いいえ。変換にはブラウザ内蔵の辞書を使用し、ローカルで実行されます。貼り付けたテキストはデバイスから送信されません。