Инструмент преобразования пиньинь
Онлайн-конвертер китайского в пиньинь с знаками тонов, номерами тонов и без тонов
Что такое конвертер китайского в пиньинь?
Конвертер пиньиня преобразует китайские иероглифы в Hanyu Pinyin — официальную систему романизации стандартного мандаринского. Пиньинь показывает произношение, тоны и структуру слогов, поэтому полезен в изучении языка, словарях, учебных материалах, транслитерации имен, сортировке, методах ввода и подготовке данных. Инструмент может показывать тоны диакритикой, цифрами или без тонов, а также менять разделители и регистр. Главная граница — неоднозначность: многие иероглифы имеют несколько чтений, а правильное произношение часто зависит от контекста слова. Имена, термины, диалектные и исторические тексты нужно проверять вручную. Особенно это важно для учебных материалов и публичных списков имен. Для формального использования нужно явно фиксировать исходную единицу, правило округления и требуемую точность.
Как использовать
Как использовать
- Вставьте или введите китайский текст в левое поле ввода
- Выберите стиль тонов, разделитель и регистр в параметрах ниже
- Результаты пиньиня появятся автоматически в правом поле вывода
- Нажмите «Копировать», чтобы сохранить результат
Примечания по конвертации
- Проверяйте имена собственные и названия мест вручную: пиньинь многозначных иероглифов зависит от контекста и может потребовать корректировки.
- Выбирайте знаки тонов, номера тонов или их отсутствие в зависимости от того, где будет использоваться результат.
Применение
Технический принцип
Основная сложность конвертации китайского в пиньинь — многозначные иероглифы (полифоны): один и тот же иероглиф может иметь разные чтения в разных словах, например «чжун» читается zhong4 в «zhongyao» (важно), но chong2 в «chongfu» (повторять); «син» читается hang2 в «yinhang» (банк), но xing2 в «xingzou» (идти). Наивный поиск по отдельным иероглифам даёт много ошибок, поэтому современные инструменты используют стратегию «словарь в первую очередь, запасной вариант — одиночный иероглиф». Этот инструмент построен на библиотеке pinyin-pro, содержащей сотни тысяч словарных записей. При обработке текста сначала выполняется токенизация алгоритмом最长совпадения; слова, найденные в словаре, используют словарное чтение, а оставшиеся одиночные иероглифы подставляют наиболее частое чтение из таблицы одиночных символов. Для слов, содержащих «yi» (один), также применяются правила перестановки тонов: «yi» читается yi2 перед символом 4-го тона, yi4 перед другими тонами и yi1 в отдельном употреблении. Существует два способа отображения тонов: знаки тонов (a, a, a, a) пишутся непосредственно над гласной и наиболее читабельны; номера тонов (a1, a2, a3, a4) ставятся в конце пиньиня и удобны для передачи и хранения в ASCII-символах. В структуре пиньиня: пиньинь = инициаль (23 штуки, напр. b, p, m, f) + финаль (24 штуки, напр. a, o, e, ai) + тон (4 + нейтральный), и их можно разделить для обучения и индексации. Hanyu Pinyin — официальная система романизации КНР, опубликованная в 1958 году. Более старые или альтернативные системы включают Wade-Giles (напр. Beijing как «Pei-ching»), почтовую романизацию («Peking») и Чжуинь/Бопомофо (ㄅ ㄆ ㄇ ㄈ), используемые на Тайване. Они всё ещё встречаются в именах собственных, исторических документах и традиционных изданиях, но повседневное использование доминирует за Hanyu Pinyin.
- Используется стратегия «словарь в первую очередь, запасной вариант — одиночный иероглиф»: чтения многозначных иероглифов ищутся по слову, затем для одиночных символов подставляется наиболее частое чтение.
- pinyin-pro содержит сотни тысяч словарных записей, покрывающих случаи многозначных иероглифов для подавляющего большинства повседневной лексики.
- Знаки тонов (a) наиболее читабельны; номера тонов (a1) удобнее для хранения и передачи — две формы можно конвертировать друг в друга.
- Правила перестановки тонов для «yi» и «bu», а также эрхуизация (ретрофлексия) и нейтральный тон применяются автоматически по фонетическим правилам точнее, чем простая табличная подстановка.
- Пиньинь можно разделить на инициаль + финаль + тон для поддержки различных сценариев: аннотация, поисковая индексация и обучение.
- Hanyu Pinyin, Wade-Giles и Чжуинь — разные системы романизации из разных периодов и регионов; они не взаимозаменяемы.
Примеры
Знаки тонов
Вход: 中国 (два иероглифа)
Режим: знаки тонов (диакритика)
Выход: zhōng guó
Применение: печатные материалы, слайды, учебникиЦифры тонов
Вход: 中国 (два иероглифа)
Режим: цифры тонов
Выход: zhong1 guo2
Применение: системы простого текста, не поддерживающие комбинируемую диакритикуРазрешение полифонов
Вход: 银行 (банк) / 行走 (идти)
Режим: знаки тонов, приоритет словарного поиска
Выход: yín háng / xíng zǒu
Примечание: иероглиф 行 читается как xíng в 行走, но háng в 银行; инструмент использует контекст слова для выбора правильного чтенияВерхний регистр с пользовательским разделителем
Вход: 北京欢迎你 (Пекин приветствует тебя)
Режим: верхний регистр, разделитель = "-"
Выход: BEI-JING-HUAN-YING-NI
Применение: URL-слаги, имена файлов, словарные списки для занятийЧасто задаваемые вопросы
Конвертирует упрощённый или традиционный китайский?
Оба. Страница принимает любую форму и выводит ханьюй пиньинь. Многозначные иероглифы (多音字) вроде 重, 长, 行, 着 различаются по словарю фраз, поэтому 银行 → yín háng (банк), 行走 → xíng zǒu (идти), а не наоборот.
Как отмечаются тона?
Доступно три стиля: знаки тонов (zhōng wén), цифры (zhong1 wen2) и без тонов (zhong wen). По умолчанию — знаки тонов; переключайтесь на цифры для систем, не отображающих диакритику, или на «без тонов» для романизированных поисковых ключевых слов.
А как же нейтральный тон (轻声)?
Слова с нейтральным тоном вроде 妈妈, 桌子, 漂亮 выводятся без знака тона на втором слоге (māma, zhuōzi, piàoliang). Это соответствует материковому китайскому стандарту произношения. Тайваньская разметка тоном-5 доступна как опция.
Корректно ли обрабатываются собственные имена?
Распространённые фамилии и топонимы есть в словаре. Менее распространённые имена с иероглифами, меняющими тон (например, 区 как Ōu или qū, 单 как Shàn или dān), могут получить неправильное чтение — проверяйте после конверсии. Иностранные имена, транслитерированные на китайский (например, 史密斯), читаются по иероглифам.
Применяются ли правила сандхи тонов?
Базовое сандхи — третий тон перед третьим становится вторым+третьим (你好 → níhǎo) — применяется при включении опции. Большинство других случаев сандхи (изменения 一 / 不 / 七 / 八) сильнее зависят от контекста, и страница оставляет исходный знак тона видимым, чтобы не скрывать структуру.
Можно ли конвертировать пиньинь обратно в иероглифы?
Надёжно — нет. Пиньинь-в-ханьцзы крайне неоднозначен (zhi может быть 之/只/直/止/止…), и это работа метода ввода, а не конвертера. Для такого направления используйте настоящий IME или ИИ-генератор текста.
Загружается ли текст на сервер?
Нет. Конверсия использует встроенный словарь и работает локально. Вставленный текст не покидает ваш браузер.