Conversor de Chino Simplificado-Tradicional
Convierte entre chino simplificado y tradicional con estándares de Taiwán y Hong Kong
¿Qué es la Conversión Simplificado-Tradicional?
El conversor de chino transforma texto entre chino simplificado y chino tradicional, teniendo en cuenta más que la forma de cada carácter. El chino simplificado se usa principalmente en China continental y Singapur, mientras que el tradicional es habitual en Taiwán, Hong Kong, Macao y muchas comunidades chinas de ultramar.
Una localización real también debe considerar vocabulario regional, términos técnicos, nombres propios, puntuación y expectativas del público, no solo reemplazos uno a uno. La herramienta sirve para sitios web, documentos, textos de producto, subtítulos y artículos de soporte, pero materiales legales, médicos, de marca o muy visibles deberían revisarse por hablantes nativos del mercado objetivo.
Cómo usar
Cómo usar
- Pega o introduce texto en chino en el cuadro de entrada izquierdo
- Selecciona un método de conversión con los botones de abajo (de simplificado a tradicional, de tradicional a simplificado, tradicional de Taiwán, tradicional de Hong Kong)
- El texto convertido aparece automáticamente en el panel de salida de la derecha
- Haz clic en 'Copiar' para guardar el resultado o en 'Intercambiar' para invertir la conversión
Consejos de localización
- La conversión de caracteres no es lo mismo que la localización completa; el vocabulario regional, la puntuación y la terminología del producto pueden requerir revisión manual.
- Para textos legales, médicos, de marca o de cara al público, pide a un hablante nativo de la región de destino que revise el resultado convertido.
Casos de uso
Principio técnico
La conversión se basa en los archivos léxicos de OpenCC (Open Chinese Convert) en lugar de una sustitución carácter a carácter simplista. OpenCC incluye diccionarios separados para cada dirección de conversión: s2t (simplificado a tradicional), t2s (tradicional a simplificado), s2tw (simplificado a Taiwán), s2hk (simplificado a Hong Kong), s2twp (simplificado a Taiwán con conversión de frases) y tw2sp (Taiwán a simplificado con frases), y los aplica mediante una segmentación de coincidencia máxima hacia adelante que prefiere la frase coincidente más larga de un trie precompilado. Por eso un único carácter simplificado como 后 puede dividirse correctamente entre 后 (reina, conservado) y 後 (después, mapeado) según la palabra circundante: 皇后 coincide en el diccionario de frases antes de que se active el diccionario de caracteres. Los datos de caracteres residen en el bloque CJK Unified Ideographs U+4E00-U+9FFF, con las extensiones A (U+3400-U+4DBF) y B (U+20000-U+2A6DF) para glifos más raros. Las cadenas de JavaScript son UTF-16, por lo que un carácter de la extensión B ocupa un par sustituto (dos unidades de código) y el conversor debe iterar por punto de código y no por índice .charAt para evitar dividir un sustituto. Las variantes regionales se gestionan encadenando diccionarios: s2tw ejecuta el mapeo base s2t y luego una sustitución de vocabulario específica de Taiwán (por ejemplo, 软件 -> 軟體, 网络 -> 網路, 内存 -> 記憶體), mientras que s2hk aplica una tabla de Hong Kong que conserva 軟件 y prefiere 視像 sobre 視頻. Las tablas de frases codifican la divergencia cultural que comenzó tras el Plan de Simplificación de 1956 en la República Popular China y continúa con las recomendaciones del MOE de Taiwán y las listas del Bureau de Educación de Hong Kong. La conversión sin pérdidas de ida y vuelta no está garantizada: 干 en simplificado fusiona 干 (seco, tronco), 乾 (seco) y 干 (hacer, tronco), de modo que s2t seguido de t2s en una frase que contenga 乾 puede resolver de vuelta a 干 y luego reexpandirse de forma diferente en un nuevo contexto. La conversión de puntuación (comillas de media anchura 「」 a comillas de ancho completo, o anidamiento 「」 continental frente a 『』 de Taiwán) es un paso de diccionario independiente y no todos los motores lo activan por defecto. Trata la salida de OpenCC como un borrador de alta calidad para contenido regional; los nombres de marca, los nombres propios y los términos técnicos de creación reciente aún necesitan revisión humana según el uso real del mercado objetivo.
- Segmentación de coincidencia máxima hacia adelante sobre un trie de frases precompilado, no sustitución ciega de caracteres.
- Rango de origen CJK Unified Ideographs U+4E00-U+9FFF; la extensión B en U+20000+ se codifica como un par sustituto UTF-16.
- Los mapeos uno a muchos (后/後/后, 干/乾/幹/榦, 发/發/髮) se resuelven por contexto de frase, no por carácter aislado.
- Cadenas de variantes: s2t -> TWVariants para s2tw, s2t -> HKVariants para s2hk, con tablas de frases opcionales (s2twp).
- La conversión no siempre es reversible: un ciclo s2t y luego t2s puede colapsar caracteres simplificados fusionados de vuelta a una forma tradicional diferente.
- Iterar por punto de código Unicode (for..of o Array.from) para que los caracteres con par sustituto no se dividan en dos mitades.
- La conversión de puntuación (por ejemplo, estilo de comillas) reside en un diccionario separado y debe activarse explícitamente.
Ejemplos
De simplificado a tradicional (palabras básicas)
Entrada: 学习中文很有趣,我喜欢看电视和听音乐。
Salida : 學習中文很有趣,我喜歡看電視和聽音樂。
Notas : Mapeo estándar carácter por carácter usando OpenCC s2t.De tradicional a simplificado
Entrada: 請打開電腦,然後啟動瀏覽器。
Salida : 请打开电脑,然后启动浏览器。
Notas : Útil para adaptar artículos de Taiwán/HK a una audiencia de China continental.De simplificado a tradicional de Taiwán (con vocabulario)
Entrada: 这个软件的网络连接出现问题,请检查内存。
Salida : 這個軟體的網路連線出現問題,請檢查記憶體。
Notas : 软件->軟體, 网络->網路, 连接->連線, 内存->記憶體 (términos localizados de TW).De simplificado a tradicional de Hong Kong (términos de HK)
Entrada: 这个软件支持视频通话和打印功能。
Salida : 這個軟件支援視像通話和打印功能。
Notas : 软件->軟件 (HK conserva 軟件), 视频->視像 (término preferido en HK).Carácter de uno a varios: 后 vs 後
Entrada: 皇后走在皇帝的后面。
Salida : 皇后走在皇帝的後面。
Explica: 皇后 (emperatriz) se mantiene como 后, pero 后面 (detrás) se convierte en 後面.Preguntas frecuentes
¿Cuál es la diferencia entre chino simplificado y tradicional?
El chino simplificado (简体) se usa en China continental y Singapur; los caracteres se simplificaron sistemáticamente a partir de los años 50 (p. ej. 龍 → 龙). El chino tradicional (繁體) se usa en Taiwán y Hong Kong, conservando las formas más antiguas. Algunos caracteres son idénticos en ambos.
¿El tradicional de Taiwán y el de Hong Kong son iguales?
Casi siempre, pero no del todo. Taiwán usa la «Forma Estándar de Caracteres Nacionales» (國字標準字體) y Hong Kong usa la «Lista de Grafemas de Caracteres Chinos de Uso Común» (常用字字形表). Difieren en unos cientos de caracteres (裡/裏, 麼/麽, 著/着), por lo que elegir la región correcta importa para los lectores nativos.
¿La conversión preserva los límites entre palabras?
La conversión carácter a carácter mantiene el espaciado original tal cual. La página también aplica un diccionario a nivel de frase para que 計算機 ↔ 計算機/电脑 y 软件 ↔ 軟體 se manejen correctamente entre los dos lados del estrecho, no solo a nivel visual de carácter.
¿La conversión es sin pérdidas?
De simplificado a tradicional a veces es ambigua porque un mismo carácter simplificado puede corresponder a varias formas tradicionales: 后 puede ser 后 (reina) o 後 (después). La página aplica heurísticas de contexto, pero no puede garantizar la corrección palabra por palabra; revisa los textos importantes.
¿Maneja texto vertical o puntuación?
La puntuación se convierte (, ↔ , ; 。↔ 。 son iguales; algunas comillas 「」/“”/'' cambian según la región). El diseño vertical es un asunto de visualización, no de conversión: copia el resultado y pégalo en un contenedor con disposición vertical.
¿Por qué a veces 'phone' se convierte en 電話 y otras en 電話?
Las dos cadenas son iguales. Algunas aplicaciones usan puntos de código ligeramente distintos (variantes de compatibilidad) para caracteres visualmente idénticos. La salida usa la forma estándar para la región elegida; si una herramienta posterior la marca como «incorrecta», esa herramienta está comparando contra una variante no estándar.
¿Se sube el texto a algún servidor?
No. La conversión usa un diccionario en el navegador y se ejecuta de forma local. El texto pegado nunca sale de tu dispositivo.