Conversor Chinês Simplificado-Tradicional
Converta entre Chinês Simplificado e Tradicional com padrões de Taiwan e Hong Kong
O que é Conversão Simplificado-Tradicional?
O conversor de chinês transforma textos entre chinês simplificado e tradicional, considerando mais do que a forma isolada dos caracteres. O chinês simplificado é usado principalmente na China continental e em Singapura, enquanto o tradicional é comum em Taiwan, Hong Kong, Macau e muitas comunidades chinesas no exterior.
Uma localização real também precisa observar vocabulário regional, termos técnicos, nomes próprios, pontuação e expectativas do público, não apenas substituições caractere por caractere. A ferramenta é útil para sites, documentos, textos de produto, legendas e artigos de suporte, mas materiais jurídicos, médicos, sensíveis à marca ou muito públicos devem ser revisados por falantes nativos da região alvo.
Como Usar
Como usar
- Cole ou digite o texto em chinês na caixa de entrada à esquerda
- Clique em um botão abaixo para escolher o método de conversão (Simplificado para Tradicional, Tradicional para Simplificado, Tradicional de Taiwan, Tradicional de Hong Kong)
- O texto convertido aparece automaticamente na caixa de saída à direita
- Clique em 'Copiar' para salvar o resultado ou 'Trocar' para inverter a conversão
Dicas de Localização
- A conversão de caracteres não substitui a localização completa; vocabulário regional, pontuação e terminologia de produto ainda podem exigir revisão manual.
- Para textos jurídicos, médicos, de marca ou voltados ao público, peça a um falante nativo da região-alvo para revisar o resultado convertido.
Casos de uso
Princípio técnico
A conversão é conduzida por arquivos de léxico do OpenCC (Open Chinese Convert) e não por substituição simplificada caractere por caractere. O OpenCC distribui dicionários separados para cada direção de conversão - s2t (Simplificado para Tradicional), t2s (Tradicional para Simplificado), s2tw (Simplificado para Taiwan), s2hk (Simplificado para Hong Kong), s2twp (Simplificado para Taiwan com conversão de expressões), tw2sp (Taiwan para Simplificado com expressões) - e os aplica por meio de uma segmentação de correspondência progressiva máxima que prefere a expressão mais longa encontrada em uma trie pré-compilada. É por isso que um único caractere simplificado como 后 pode ser corretamente dividido entre 后 (rainha, mantido) e 後 (depois, mapeado) dependendo da palavra ao redor: 皇后 casa com o dicionário de expressões antes que o dicionário de caracteres entre em ação. Os dados de caracteres residem no bloco CJK Unified Ideographs U+4E00-U+9FFF, com extensões A (U+3400-U+4DBF) e B (U+20000-U+2A6DF) para glifos mais raros. As strings em JavaScript são UTF-16, então um caractere da extensão B ocupa um par substituto (duas unidades de código) e o conversor deve iterar por ponto de código e não por índice .charAt para evitar dividir um substituto. Variantes regionais são tratadas encadeando dicionários: s2tw executa o mapeamento base s2t e depois uma substituição de vocabulário específica de Taiwan (por exemplo, 软件 -> 軟體, 网络 -> 網路, 内存 -> 記憶體), enquanto s2hk aplica uma tabela de Hong Kong que mantém 軟件 e prefere 視像 em vez de 視頻. As tabelas de expressões codificam a divergência cultural que começou após o Esquema de Simplificação de 1956 na RPC e continua com as recomendações do MOE de Taiwan e as listas do Bureau de Educação de Hong Kong. A reversibilidade sem perdas não é garantida: 干 em simplificado funde 干 (seco, tronco), 乾 (seco) e 幹 (fazer, tronco), de modo que s2t seguido de t2s em uma frase contendo 乾 pode resolver de volta para 干 e depois reexpandir de forma diferente em um novo contexto. A conversão de pontuação (aspas meia-width 「」 para aspas full-width, ou aninhamento continental 「」 vs Taiwan 『』) é uma passagem de dicionário separada e nem todos os motores a habilitam por padrão. Trate a saída do OpenCC como um rascunho de alta qualidade para cópia regional; nomes de marcas, nomes próprios e termos técnicos recentes ainda precisam de revisão humana de acordo com o uso real do mercado-alvo.
- Segmentação de correspondência progressiva máxima sobre uma trie de expressões pré-compilada, não substituição cega de caracteres.
- Faixa de origem CJK Unified Ideographs U+4E00-U+9FFF; extensão B em U+20000+ é codificada como par substituto UTF-16.
- Mapeamentos um-para-muitos (后/後/后, 干/乾/幹/榦, 发/發/髮) são resolvidos pelo contexto da expressão, não pelo caractere isolado.
- Cadeias de variantes: s2t -> TWVariants para s2tw, s2t -> HKVariants para s2hk, com tabelas de expressões opcionais (s2twp).
- A conversão nem sempre é reversível: ida e volta s2t e depois t2s pode colapsar caracteres simplificados fundidos de volta para uma forma tradicional diferente.
- Itere por ponto de código Unicode (for..of ou Array.from) para que caracteres com par substituto não sejam divididos ao meio.
- A conversão de pontuação (por exemplo, estilo de aspas) reside em um dicionário separado e deve ser alternada explicitamente.
Exemplos
Simplificado para Tradicional (palavras básicas)
Entrada: 学习中文很有趣,我喜欢看电视和听音乐。
Saída : 學習中文很有趣,我喜歡看電視和聽音樂。
Notas : Mapeamento padrão caractere por caractere usando OpenCC s2t.Tradicional para Simplificado
Entrada: 請打開電腦,然後啟動瀏覽器。
Saída : 请打开电脑,然后启动浏览器。
Notas : Útil para adaptar artigos de Taiwan/HK para o público da China continental.Simplificado para Tradicional de Taiwan (com vocabulário)
Entrada: 这个软件的网络连接出现问题,请检查内存。
Saída : 這個軟體的網路連線出現問題,請檢查記憶體。
Notas : 软件->軟體, 网络->網路, 连接->連線, 内存->記憶體 (termos localizados de TW).Simplificado para Tradicional de Hong Kong (termos de HK)
Entrada: 这个软件支持视频通话和打印功能。
Saída : 這個軟件支援視像通話和打印功能。
Notas : 软件->軟件 (HK mantém 軟件), 视频->視像 (termo preferido em HK).Caractere de um para muitos: 后 vs 後
Entrada : 皇后走在皇帝的后面。
Saída : 皇后走在皇帝的後面。
Explica.: 皇后 (imperatriz) permanece como 后, mas 后面 (atrás) converte para 後面.Perguntas frequentes
Qual a diferença entre chinês simplificado e tradicional?
O chinês simplificado (简体) é usado na China continental e em Singapura; os caracteres foram simplificados sistematicamente a partir da década de 1950 (ex.: 龍 → 龙). O chinês tradicional (繁體) é usado em Taiwan e Hong Kong, mantendo as formas antigas dos caracteres. Alguns caracteres parecem idênticos nos dois sistemas.
O tradicional de Taiwan e o de Hong Kong são iguais?
Em sua maioria, mas nem sempre. Taiwan usa o 'Padrão dos Caracteres Nacionais' (國字標準字體), enquanto Hong Kong usa a 'Lista de Grafemas dos Caracteres Chineses de Uso Comum' (常用字字形表). Eles diferem em algumas centenas de caracteres — 裡/裏, 麼/麽, 著/着 — então escolher a região certa importa para leitores nativos.
A conversão preserva os limites das palavras?
A conversão caractere a caractere preserva o espaçamento original com exatidão. A página também aplica um dicionário em nível de frase para que 計算機 ↔ 計算機/电脑 e 软件 ↔ 軟體 sejam tratados corretamente entre os dois lados do estreito, não só na forma visual do caractere.
A conversão é sem perdas?
A conversão de simplificado para tradicional às vezes é ambígua porque um caractere simplificado pode corresponder a múltiplas formas tradicionais — 后 mapeia para 后 (rainha) ou 後 (depois). A página usa heurísticas de contexto, mas não consegue garantir correção em cada palavra; revise textos importantes.
Lida com texto vertical ou pontuação?
A pontuação é convertida (, ↔ ,;。↔ 。 são iguais; algumas aspas 「」/“”/'' mudam por região). O layout vertical é uma questão de exibição, não de conversão — copie o resultado e cole em um contêiner com layout vertical.
Por que às vezes 'phone' é convertido como 電話 e às vezes como 電話?
As duas formas são a mesma string. Alguns aplicativos usam pontos de código ligeiramente diferentes (variantes de compatibilidade) para caracteres visualmente idênticos. A saída usa a forma padrão para a região escolhida; se uma ferramenta seguinte sinalizar como 'errado', é essa ferramenta que está comparando contra uma variante não padrão.
O texto é enviado para algum servidor?
Não. A conversão usa um dicionário no navegador e roda localmente. O texto colado nunca sai do seu dispositivo.