간체-번체 변환 도구
간체 중국어와 번체 중국어를 상호 변환하며, 대만 및 홍콩 표준을 지원합니다
간체-번체 변환이란?
간체-번체 변환은 간체 중국어와 번체 중국어 간의 상호 변환을 말합니다. 중국 대륙에서는 간체 중국어를 사용하며, 대만, 홍콩, 마카오 및 해외 중국인 커뮤니티에서는 주로 번체 중국어를 사용합니다.
이 도구는 다양한 변환 표준을 지원합니다: 간체를 번체로, 번체를 간체로, 그리고 대만 및 홍콩 지역의 현지화 변환(지역별 용어 차이 고려)을 지원합니다.
인명, 지명, 브랜드명, 고전 문헌처럼 문맥 의존성이 큰 텍스트는 자동 변환 후 반드시 사람이 확인해야 합니다. 문자 모양만 바뀌어도 지역별 표현이나 의미가 달라질 수 있습니다.
사용 방법
사용 방법
- 왼쪽 입력 상자에 중국어 텍스트를 붙여넣거나 입력하세요
- 아래 버튼을 클릭하여 변환 방법을 선택하세요 (간체→번체, 번체→간체, 대만 번체, 홍콩 번체)
- 변환된 텍스트가 오른쪽 출력 상자에 자동으로 표시됩니다
- '복사'를 클릭하여 결과를 저장하거나, '교환'을 클릭하여 변환 방향을 반전하세요
현지화 팁
- 문자 변환은 완전한 현지화와 다릅니다. 지역별 어휘, 구두점, 제품 용어는 여전히 수동 검토가 필요할 수 있습니다.
- 법률, 의료, 브랜드 또는 대외용 문구의 경우, 해당 지역의 원어민에게 변환 결과를 확인받으세요.
활용 사례
기술 원리
변환은 단순한 글자 단위 치환이 아니라 OpenCC(Open Chinese Convert) 어휘 파일을 기반으로 동작합니다. OpenCC는 각 변환 방향별로 별도의 사전을 제공합니다 - s2t(간체→번체), t2s(번체→간체), s2tw(간체→대만), s2hk(간체→홍콩), s2twp(간체→대만+구문 변환), tw2sp(대만→간체+구문) - 이 사전들을 미리 컴파일된 trie에서 가장 긴 매칭 구문을 우선하는 최대 전방 일치 분할 방식으로 적용합니다. 이것이 바로 단일 간체 글자 '后'가 주변 단어에 따라 후(왕비, 유지)와 後(이후, 매핑)로 올바르게 분리될 수 있는 이유입니다: '皇后'는 구문 사전에서 먼저 매칭되어 글자 사전이 발동하기 전에 올바르게 처리됩니다. 글자 데이터는 CJK 통합 한자 블록 U+4E00-U+9FFF에 위치하며, 확장 A(U+3400-U+4DBF)와 확장 B(U+20000-U+2A6DF)는 더 희귀한 글리프를 다룹니다. JavaScript 문자열은 UTF-16이므로 확장 B 문자는 서로게이트 페어(두 코드 유닛)를 차지하며, 변환기는 서로게이트를 분할하지 않도록 .charAt 인덱스 대신 코드 포인트 단위로 반복해야 합니다. 지역 변형은 사전 체이닝으로 처리됩니다: s2tw는 기본 s2t 매핑을 실행한 뒤 대만 특화 어휘 치환(예: 软件→軟體, 网络→網路, 内存→記憶體)을 적용하고, s2hk는 軟件를 유지하고 視頻 대신 視像을 선호하는 홍콩 테이블을 적용합니다. 구문 테이블은 1956년 중화인민공화국의 간체자 방안 이후 시작되어 대만 교육부 권장사항과 홍콩 교육국 목록으로 이어지는 문화적 분기를 인코딩합니다. 무손실 왕복 변환은 보장되지 않습니다: 간체의 '干'는 干(마를 간, 줄기), 乾(마를 건), 幹(할 간, 줄기)를 합친 것이므로, s2t 후 t2s를 적용하면 乾이 포함된 문장에서 干로 되돌아간 뒤 새 문맥에서 다르게 재확장될 수 있습니다. 구두점 변환(반각 「」에서 전각 따옴표로, 또는 본토 「」 대 대만 『』 중첩)은 별도의 사전 패스이며 모든 엔진이 기본적으로 활성화하지는 않습니다. OpenCC 출력을 지역별 교정을 위한 고품질 초안으로 취급하고, 브랜드명, 고유명사, 최근 생성된 기술 용어는 대상 시장의 실제 용법에 따라 사람이 검토해야 합니다.
- 미리 컴파일된 구문 trie 기반의 최대 전방 일치 분할 방식이며, 단순 글자 치환이 아닙니다.
- 소스 범위는 CJK 통합 한자 U+4E00-U+9FFF이며, 확장 B(U+20000+)는 UTF-16 서rogate 페어로 인코딩됩니다.
- 일대다 매핑(后/後/后, 干/乾/幹/榦, 发/發/髮)은 글자가 아닌 구문 문맥으로 해결됩니다.
- 변형 체인: s2t → TWVariants(대만용), s2t → HKVariants(홍콩용), 선택적 구문 테이블(s2twp) 포함.
- 변환은 항상 가역적이지 않습니다: s2t 후 t2s 왕복 시 병합된 간체자가 다른 번체 형태로 축소될 수 있습니다.
- Unicode 코드 포인트 단위로 반복(for..of 또는 Array.from)하여 서rogate 페어 문자가 분할되지 않도록 합니다.
- 구두점 변환(예: 따옴표 스타일)은 별도의 사전에 위치하며 명시적으로 토글해야 합니다.
예시
간체 → 번체 (기본 단어)
입력 : 学习中文很有趣,我喜欢看电视和听音乐。
출력 : 學習中文很有趣,我喜歡看電視和聽音樂。
비고 : OpenCC s2t를 이용한 표준 글자 단위 매핑.번체 → 간체
입력 : 請打開電腦,然後啟動瀏覽器。
출력 : 请打开电脑,然后启动浏览器。
비고 : 대만/홍콩 자료를 본토 독자용으로 변환할 때 유용.간체 → 대만 번체 (어휘 변환 포함)
입력 : 这个软件的网络连接出现问题,请检查内存。
출력 : 這個軟體的網路連線出現問題,請檢查記憶體。
비고 : 软件->軟體, 网络->網路, 连接->連線, 内存->記憶體 (대만 현지화 용어).간체 → 홍콩 번체 (홍콩 용어)
입력 : 这个软件支持视频通话和打印功能。
출력 : 這個軟件支援視像通話和打印功能。
비고 : 软件->軟件 (홍콩은 軟件 유지), 视频->視像 (홍콩 선호 표현).다의자 변환: 后 vs 後
입력 : 皇后走在皇帝的后面。
출력 : 皇后走在皇帝的後面。
설명 : 皇后(황후)는 后 그대로 유지, 后面(뒤쪽)은 後面으로 변환.자주 묻는 질문
간체자와 번체자의 차이는 무엇인가요?
간체자(简体)는 중국 본토와 싱가포르에서 사용되며 1950년대부터 한자를 체계적으로 간소화한 것입니다(예: 龍 → 龙). 번체자(繁體)는 대만과 홍콩에서 사용되며 옛 한자 형태를 유지합니다. 일부 한자는 두 체계에서 동일하게 보이기도 합니다.
대만과 홍콩의 번체자는 같은가요?
대부분 같지만 항상 그런 것은 아닙니다. 대만은 '국자표준자체(國字標準字體)'를, 홍콩은 '상용자자형표(常用字字形表)'를 사용합니다. 裡/裏, 麼/麽, 著/着 등 수백 자에서 차이가 있어, 현지 독자에게는 어느 지역 표준을 선택하는지가 중요합니다.
변환 후 단어 경계가 유지되나요?
글자 단위 변환은 원본 띄어쓰기를 그대로 보존합니다. 또한 페이지에서는 어휘 단위 사전을 적용해 計算機 ↔ 计算机/电脑, 软件 ↔ 軟體처럼 양안에서 다른 단어도 단순한 글자 형태가 아닌 의미에 맞게 변환합니다.
변환 결과는 손실 없이 정확한가요?
간체에서 번체로 변환할 때 한 간체자가 여러 번체자에 대응할 수 있어 모호한 경우가 있습니다. 예를 들어 后는 后(왕후)나 後(이후)로 매핑됩니다. 페이지는 문맥 기반 휴리스틱을 사용하지만 모든 단어에서 정확성을 보장할 수는 없으므로 중요한 텍스트는 직접 검토하세요.
세로쓰기 텍스트나 문장부호도 처리되나요?
문장부호도 변환됩니다(, ↔ ,;。↔ 。는 동일하지만 일부 따옴표 「」/“”/'' 등은 지역에 따라 바뀜). 세로쓰기 레이아웃은 변환이 아닌 표시 방식의 문제이므로, 변환된 결과를 복사해서 세로쓰기 컨테이너에 붙여 넣으세요.
왜 'phone'이 어떨 때는 電話, 어떨 때는 電話로 변환되나요?
사실 이 두 문자열은 같습니다. 일부 애플리케이션에서는 시각적으로 동일한 글자에 대해 약간 다른 코드 포인트(호환 변형자)를 사용합니다. 이 페이지는 선택한 지역의 표준 형태를 출력하므로, 다른 도구에서 '오류'로 표시된다면 그 도구가 비표준 변형자와 비교하고 있는 것입니다.
텍스트가 서버로 업로드되나요?
아니요. 변환은 브라우저 내장 사전을 사용해 로컬에서 실행됩니다. 붙여넣은 텍스트는 기기를 떠나지 않습니다.