Convertisseur chinois simplifié/traditionnel
Convertir entre chinois simplifié et traditionnel avec les standards Taiwan et Hong Kong
Qu'est-ce que la conversion simplifié/traditionnel ?
Le convertisseur chinois transforme un texte entre chinois simplifié et chinois traditionnel en tenant compte de plus que la forme isolée des caractères. Le chinois simplifié est surtout utilisé en Chine continentale et à Singapour, tandis que le chinois traditionnel domine à Taïwan, Hong Kong, Macao et dans de nombreuses communautés chinoises d’outre-mer.
Une vraie localisation doit aussi considérer le vocabulaire régional, les termes techniques, les noms propres, la ponctuation et les attentes du public. L’outil convient aux sites web, documents, textes produit, sous-titres et articles de support, mais les contenus juridiques, médicaux, sensibles pour la marque ou très visibles doivent être relus par des locuteurs natifs du marché visé.
Comment utiliser
Comment utiliser
- Collez ou saisissez du texte chinois dans la zone de saisie de gauche
- Cliquez sur un bouton ci-dessous pour choisir la méthode de conversion (simplifié vers traditionnel, traditionnel vers simplifié, traditionnel taïwanais, traditionnel hongkongais).
- Le texte converti apparaît automatiquement dans la zone de sortie à droite.
- Cliquez sur « Copier » pour enregistrer le résultat ou sur « Inverser » pour inverser la conversion.
Conseils de localisation
- La conversion de caractères n'est pas une localisation complète ; le vocabulaire régional, la ponctuation et la terminologie propre au produit peuvent nécessiter une relecture manuelle.
- Pour les textes juridiques, médicaux, de marque ou destinés au public, faites relire le résultat converti par un locuteur natif de la région cible.
Cas d’utilisation
Principe technique
La conversion repose sur les fichiers de dictionnaire OpenCC (Open Chinese Convert) et non sur une substitution naïve caractère par caractère. OpenCC fournit des dictionnaires séparés pour chaque direction de conversion : s2t (simplifié vers traditionnel), t2s (traditionnel vers simplifié), s2tw (simplifié vers Taiwan), s2hk (simplifié vers Hong Kong), s2twp (simplifié vers Taiwan avec conversion d'expressions), tw2sp (Taiwan vers simplifié avec expressions) — et les applique via une segmentation par correspondance gloutonne maximale (maximum-forward-match) qui privilégie la plus longue expression trouvée dans un trie précompilé. C'est pourquoi un seul caractère simplifié comme 后 peut correctement se scinder entre 后 (reine, conservé) et 後 (après, transformé) selon le mot environnant : 皇后 correspond au dictionnaire d'expressions avant que le dictionnaire de caractères n'intervienne. Les données de caractères se trouvent dans le bloc CJK Unified Ideographs U+4E00-U+9FFF, avec les extensions A (U+3400-U+4DBF) et B (U+20000-U+2A6DF) pour les glyphes plus rares. Les chaînes JavaScript sont en UTF-16, donc un caractère de l'extension B occupe une paire de suppléance (deux unités de code) et le convertisseur doit itérer par point de code plutôt que par index .charAt pour éviter de scinder une paire de suppléance. Les variantes régionales sont gérées en chaînant les dictionnaires : s2tw exécute d'abord le mapping s2t de base, puis une substitution de vocabulaire spécifique à Taiwan (par exemple 软件 -> 軟體, 网络 -> 網路, 内存 -> 記憶體), tandis que s2hk applique une table de Hong Kong qui garde 軟件 et préfère 視像 à 視頻. Les tables d'expressions encodent la divergence culturelle qui a commencé après le schéma de simplification de 1956 en RPC et se poursuit avec les recommandations du MOE de Taïwan et les listes du Bureau de l'éducation de Hong Kong. L'aller-retour sans perte n'est pas garanti : 干 en simplifié fusionne 干 (sec, tige), 乾 (sec) et 幹 (faire, tronc), donc s2t suivi de t2s sur une phrase contenant 乾 peut revenir à 干 puis se re-différencier différemment dans un nouveau contexte. La conversion de ponctuation (guillemets demi-cadratin « » vers guillemets pleins cadratin, ou imbrication continentale « » vs taïwanaise 『』) constitue un passage de dictionnaire distinct et tous les moteurs ne l'activent pas par défaut. Considérez la sortie OpenCC comme un brouillon de haute qualité pour une copie régionale ; les noms de marque, les noms propres et les termes techniques récemment créés nécessitent toujours une relecture humaine par rapport à l'usage réel du marché cible.
- Segmentation par correspondance gloutonne maximale sur un trie d'expressions précompilé, et non substitution aveugle de caractères.
- Plage source CJK Unified Ideographs U+4E00-U+9FFF ; l'extension B à U+20000+ est encodée comme une paire de suppléance UTF-16.
- Les correspondances un-vers-plusieurs (后/後/后, 干/乾/幹/槼, 发/發/髮) sont résolues par le contexte de l'expression, non par le caractère seul.
- Chaînes de variantes : s2t -> TWVariants pour s2tw, s2t -> HKVariants pour s2hk, avec tables d'expressions optionnelles (s2twp).
- La conversion n'est pas toujours réversible : un aller-retour s2t puis t2s peut ramener des caractères simplifiés fusionnés vers une forme traditionnelle différente.
- Itérer par point de code Unicode (for..of ou Array.from) pour que les caractères en paire de suppléance ne soient pas scindés en deux.
- La conversion de ponctuation (par exemple le style des guillemets) se trouve dans un dictionnaire distinct et doit être activée explicitement.
Exemples
Simplifié vers Traditionnel (mots de base)
Entrée : 学习中文很有趣,我喜欢看电视和听音乐。
Sortie : 學習中文很有趣,我喜歡看電視和聽音樂。
Notes : Mappage caractère par caractère standard avec OpenCC s2t.Traditionnel vers Simplifié
Entrée : 請打開電腦,然後啟動瀏覽器。
Sortie : 请打开电脑,然后启动浏览器。
Notes : Utile pour adapter des articles de Taïwan/HK à un public continental.Simplifié vers Traditionnel Taïwan (avec vocabulaire)
Entrée : 这个软件的网络连接出现问题,请检查内存。
Sortie : 這個軟體的網路連線出現問題,請檢查記憶體。
Notes : 软件->軟體, 网络->網路, 连接->連線, 内存->記憶體 (termes localisés TW).Simplifié vers Traditionnel Hong Kong (termes HK)
Entrée : 这个软件支持视频通话和打印功能。
Sortie : 這個軟件支援視像通話和打印功能。
Notes : 软件->軟件 (HK garde 軟件), 视频->視像 (terme préféré HK).Caractère un-vers-plusieurs : 后 vs 後
Entrée : 皇后走在皇帝的后面。
Sortie : 皇后走在皇帝的後面。
Explique: 皇后 (impératrice) reste 后, mais 后面 (derrière) devient 後面.FAQ
Quelle est la différence entre le chinois simplifié et le chinois traditionnel ?
Le chinois simplifié (简体) est utilisé en Chine continentale et à Singapour ; les caractères ont été systématiquement simplifiés à partir des années 1950 (par exemple 龍 → 龙). Le chinois traditionnel (繁體) est utilisé à Taïwan et à Hong Kong, conservant les formes anciennes des caractères. Certains caractères sont identiques dans les deux.
Le traditionnel de Taïwan et de Hong Kong est-il identique ?
En grande partie, mais pas toujours. Taïwan utilise la « Forme standard des caractères nationaux » (國字標準字體) tandis que Hong Kong utilise la « Liste des graphèmes des caractères chinois d'usage courant » (常用字字形表). Ils diffèrent sur quelques centaines de caractères — 裡/裏, 麼/麽, 著/着 — donc choisir la bonne région importe pour les lecteurs natifs.
La conversion préserve-t-elle les limites de mots ?
La conversion caractère par caractère préserve exactement l'espacement original. La page applique aussi un dictionnaire au niveau des expressions, de sorte que 計算機 ↔ 計算機/电脑 et 软件 ↔ 軟體 sont gérés correctement entre les deux rives, et pas seulement la forme visuelle des caractères.
La conversion est-elle sans perte ?
La conversion du simplifié vers le traditionnel est parfois ambiguë car un caractère simplifié peut correspondre à plusieurs formes traditionnelles : 后 correspond à 后 (reine) ou 後 (après). La page utilise des heuristiques contextuelles mais ne peut pas garantir l'exactitude pour chaque mot ; revérifiez les textes importants.
Gère-t-il le texte vertical ou la ponctuation ?
La ponctuation est convertie (, ↔ , ;。↔ 。 sont identiques ; certains guillemets 「」/«»/'' changent selon la région). La mise en page verticale est une question d'affichage, pas de conversion : copiez le résultat et collez-le dans un conteneur à mise en page verticale.
Pourquoi « phone » est-il parfois converti en 電話 et parfois en 電話 ?
Les deux sont la même chaîne. Certaines applications utilisent des points de code légèrement différents (variantes de compatibilité) pour des caractères visuellement identiques. La sortie utilise la forme standard pour la région choisie ; si un outil en aval signale cela comme « erroné », c'est qu'il compare à une variante non standard.
Le texte est-il envoyé en ligne ?
Non. La conversion utilise un dictionnaire intégré au navigateur et s'exécute localement. Le texte collé ne quitte jamais votre appareil.