简繁转换
简体中文与繁体中文互相转换,支持台湾和香港标准
什么是简繁转换?
简繁转换用于在简体中文和繁体中文之间转换文本,但真正的转换不只是把单个汉字换成另一种字形。简体中文主要用于中国大陆和新加坡,繁体中文常见于台湾、香港、澳门及许多海外华人社群,不同地区还会有词汇、标点、术语和表达习惯差异。
这个工具适合处理网页文案、文档、产品说明、字幕、客服文章和内部资料,能快速完成基础转换和地区化调整。涉及法律、医疗、品牌口径、正式公告或面向大量用户的内容时,仍应由熟悉目标地区语境的人复核,避免只转换字形却留下不自然或错误的用词。
使用方法
使用方法
- 在左侧输入框粘贴或输入中文文本
- 点击下方按钮选择转换方向(简转繁、繁转简、台湾繁体、香港繁体)
- 转换结果会自动显示在右侧输出框
- 点击「复制」保存结果,或点击「交换」反向转换
本地化提示
- 字符转换并不等于完整本地化,地区用词、标点符号及产品术语仍可能需要人工复核。
- 对于法律、医疗、品牌或对外发布的文案,建议请目标地区的母语者复核转换结果。
使用场景
技术原理
转换由 OpenCC(Open Chinese Convert)词库文件驱动,而非简单的逐字符替换。OpenCC 为每种转换方向提供独立的词典——s2t(简转繁)、t2s(繁转简)、s2tw(简转台湾)、s2hk(简转香港)、s2twp(简转台湾带词组转换)、tw2sp(台湾转简带词组)——并通过最大正向匹配分词算法应用这些词典,从预编译的 trie 树中优先选择最长匹配词组。这就是为什么单个简体字如「后」能根据上下文正确区分「后」(皇后,保留)和「後」(之后,映射):例如「皇后」会先匹配词组词典,然后字符词典才会生效。 字符数据位于 CJK 统一表意文字区块 U+4E00-U+9FFF,扩展 A(U+3400-U+4DBF)和扩展 B(U+20000-U+2A6DF)用于更罕见的字形。JavaScript 字符串使用 UTF-16 编码,因此扩展 B 的字符占用一个代理对(两个编码单元),转换器必须按码位迭代而非使用 .charAt 索引,以避免拆分代理对。地区变体通过链接词典处理:s2tw 先运行基础 s2t 映射,再进行台湾特定词汇替换(例如 软件 → 軟體、网络 → 網路、内存 → 記憶體),而 s2hk 应用香港词表,保留「軟件」并优先使用「視像」而非「視頻」。词组表编码了 1956 年中国大陆简化方案以来的文化分化,并延续到台湾教育部的推荐用字和香港教育局的用字表。 无损往返转换并不保证:简体中的「干」合并了「干」(干燥、主干)、「幹」(做、树干)和「乾」(干燥),因此 s2t 后再 t2s 处理包含「乾」的句子可能回退为「干」,然后在新的上下文中重新展开为不同的繁体形式。标点符号转换(半角「」到全角引号,或大陆「」与台湾『』的嵌套规则)是单独的词典处理流程,并非所有引擎默认启用。应将 OpenCC 的输出视为高质量的地区化初稿;品牌名、专有名词和近期出现的技术术语仍需由熟悉目标市场实际用法的人工审核。
- 基于预编译词组 trie 树的最大正向匹配分词,而非盲目逐字符替换。
- 源范围为 CJK 统一表意文字 U+4E00-U+9FFF;扩展 B(U+20000+)以 UTF-16 代理对编码。
- 一对多映射(后/後、干/乾/幹/榦、发/發/髮)通过词组上下文解析,而非仅靠单字。
- 变体链接:s2t → TWVariants 用于 s2tw,s2t → HKVariants 用于 s2hk,可选词组表(s2twp)。
- 转换不总是可逆的:s2t 再 t2s 往返转换可能将合并的简体字回退为不同的繁体形式。
- 按 Unicode 码位迭代(for..of 或 Array.from),避免将代理对字符拆分为两半。
- 标点符号转换(如引号样式)位于单独的词典中,需要显式开启。
示例
简体转繁体(基础词汇)
输入:学习中文很有趣,我喜欢看电视和听音乐。
输出:學習中文很有趣,我喜歡看電視和聽音樂。
说明:使用 OpenCC s2t 进行标准的逐字映射。繁体转简体
输入:請打開電腦,然後啟動瀏覽器。
输出:请打开电脑,然后启动浏览器。
说明:适合把台港地区的文章转给大陆读者阅读。简体转台湾繁体(含词汇转换)
输入:这个软件的网络连接出现问题,请检查内存。
输出:這個軟體的網路連線出現問題,請檢查記憶體。
说明:软件->軟體、网络->網路、连接->連線、内存->記憶體(台湾本地化用语)。简体转香港繁体(港式用语)
输入:这个软件支持视频通话和打印功能。
输出:這個軟件支援視像通話和打印功能。
说明:软件->軟件(港版保留 軟件)、视频->視像(港版常用说法)。一对多字:后 vs 後
输入:皇后走在皇帝的后面。
输出:皇后走在皇帝的後面。
说明:皇后(empress)保留为 后,但「后面」(之后/后方)会转成 後面。常见问题
简体中文和繁体中文有什么区别?
简体中文(简体)通行于中国大陆和新加坡,从 20 世纪 50 年代起对汉字进行了系统简化(如 龍 → 龙)。繁体中文(繁體)通行于台湾和香港,保留了较早的字形。还有一部分汉字在两边写法完全相同。
台湾繁体和香港繁体一样吗?
大体相同,但并非完全一致。台湾使用「國字標準字體」,香港使用「常用字字形表」,二者在数百个字上存在差异——例如 裡/裏、麼/麽、著/着——所以对当地读者而言,选对地区版本很重要。
转换会保留词语边界吗?
逐字转换会原样保留原文的间隔。页面还引入了短语级词典,使得 計算機 ↔ 计算机/电脑、软件 ↔ 軟體 这类海峡两岸的用词差异能够被正确处理,而不只是字形上的转换。
转换是无损的吗?
简体转繁体有时会存在歧义,因为一个简体字可能对应多个繁体字——比如「后」既对应「后」(皇后),也对应「後」(之后)。页面会基于上下文做启发式判断,但无法保证每个词都正确,重要文本请二次校对。
支持竖排文字或标点吗?
标点会一并转换(, ↔ ,;。 ↔ 。 是相同的;引号 「」/“”/'' 会按地区切换)。竖排属于显示问题,而非转换问题——把结果复制粘贴到竖排容器中即可。
为什么有时把「电话」转成 電話,有时也是 電話?
其实是同一个字符串,但有些应用程序对外观相同的字符使用了略有不同的码位(兼容变体)。本工具输出的是所选地区的标准字形;如果某个下游工具提示「不正确」,那是它在比对一个非标准变体。
文本会被上传吗?
不会。转换使用浏览器内置的词典在本地完成,粘贴的文本不会离开你的设备。