ToolActToolAct

Инструмент преобразования пиньинь

Онлайн-конвертер китайского в пиньинь с знаками тонов, номерами тонов и без тонов

Ввод
Символов: 0
Результат
Символов: 0

Параметры конвертации

Стиль тонов
Разделитель
Регистр
Не-китайские

Что такое конвертер китайского в пиньинь?

Конвертер пиньиня преобразует китайские иероглифы в Hanyu Pinyin — официальную систему романизации стандартного мандаринского. Пиньинь показывает произношение, тоны и структуру слогов, поэтому полезен в изучении языка, словарях, учебных материалах, транслитерации имен, сортировке, методах ввода и подготовке данных. Инструмент может показывать тоны диакритикой, цифрами или без тонов, а также менять разделители и регистр. Главная граница — неоднозначность: многие иероглифы имеют несколько чтений, а правильное произношение часто зависит от контекста слова. Имена, термины, диалектные и исторические тексты нужно проверять вручную. Особенно это важно для учебных материалов и публичных списков имен. Для формального использования нужно явно фиксировать исходную единицу, правило округления и требуемую точность.

Как использовать

Как использовать

  1. Вставьте или введите китайский текст в левое поле ввода
  2. Выберите стиль тонов, разделитель и регистр в параметрах ниже
  3. Результаты пиньиня появятся автоматически в правом поле вывода
  4. Нажмите «Копировать», чтобы сохранить результат

Примечания по конвертации

  • Проверяйте имена собственные и названия мест вручную: пиньинь многозначных иероглифов зависит от контекста и может потребовать корректировки.
  • Выбирайте знаки тонов, номера тонов или их отсутствие в зависимости от того, где будет использоваться результат.

Применение

Конвертация китайского текста в пиньинь для учебы или транслитерацииВставьте китайский текст и сгенерируйте пиньинь с помощью pinyin-pro — со знаками тонов, номерами тонов или без тонов. Результат может сохранять пробелы, использовать запятые, удалять разделители или применять произвольный разделитель для задач именования, учебы или транслитерации. Знаки тонов лучше подходят для печатных материалов и презентаций, а номера тонов удобнее для набора и хранения в текстовых системах.
Подготовка имён и надписей в выбранном стилеВарианты вывода строчными, заглавными и с заглавной буквы помогают адаптировать пиньинь к спискам контактов, именам файлов, этикеткам продуктов, учебным материалам и поисковым ключам. Произвольный разделитель полезен для slug'ов или дефисной романизации. Сначала прогоните несколько тестовых имён через конвертер, чтобы убедиться, что регистр и разделители соответствуют правилам файловой системы или URL, где будет жить результат.
Очистка смешанного китайского и не-китайского текстаВыберите, сохранять ли оригинальные не-китайские символы или удалять их из сгенерированного вывода. Это помогает при конвертации абзацев, содержащих пунктуацию, цифры, латинский текст или символы, когда итоговый результат должен фокусироваться на произношении. Удаление не-китайского шума делает столбец пиньиня удобнее для просмотра во время учебных занятий.
Ручная обработка многозначных иероглифов и редких чтенийТакие иероглифы, как 行, 长 и 乐, имеют несколько чтений, и pinyin-pro выбирает из них по контексту слова. Проверяйте названия продуктов, географические названия и исторические термины вручную, а не полагайтесь на то, что чтение по умолчанию совпадает с ожиданиями вашей аудитории. Краткая проверка имён и заголовков отлавливает самые частые ошибки пиньиня перед публикацией.
Различение знаков тонов и номерных тонов, а также 多音字 (重/還)Выберите знаки тонов для человекочитаемого вывода или номерные тоны (ma1, ma2, ma3, ma4, ma5) для систем, не поддерживающих комбинирующие диакритические знаки, и помните, что один и тот же иероглиф может быть настоящим 多音字 — 重 читается как zhong4 в 重要 (важно), но chong2 в 重新 (снова), а 還 — hai2 в 還是 (всё ещё), но huan2 в 還原 (восстановить). Стратегия «словарь первый, одиночный иероглиф запасной» в основе pinyin-pro всё равно опирается на контекст, поэтому проверяйте чтения терминов, меняющих значение в зависимости от тона.

Технический принцип

Основная сложность конвертации китайского в пиньинь — многозначные иероглифы (полифоны): один и тот же иероглиф может иметь разные чтения в разных словах, например «чжун» читается zhong4 в «zhongyao» (важно), но chong2 в «chongfu» (повторять); «син» читается hang2 в «yinhang» (банк), но xing2 в «xingzou» (идти). Наивный поиск по отдельным иероглифам даёт много ошибок, поэтому современные инструменты используют стратегию «словарь в первую очередь, запасной вариант — одиночный иероглиф». Этот инструмент построен на библиотеке pinyin-pro, содержащей сотни тысяч словарных записей. При обработке текста сначала выполняется токенизация алгоритмом最长совпадения; слова, найденные в словаре, используют словарное чтение, а оставшиеся одиночные иероглифы подставляют наиболее частое чтение из таблицы одиночных символов. Для слов, содержащих «yi» (один), также применяются правила перестановки тонов: «yi» читается yi2 перед символом 4-го тона, yi4 перед другими тонами и yi1 в отдельном употреблении. Существует два способа отображения тонов: знаки тонов (a, a, a, a) пишутся непосредственно над гласной и наиболее читабельны; номера тонов (a1, a2, a3, a4) ставятся в конце пиньиня и удобны для передачи и хранения в ASCII-символах. В структуре пиньиня: пиньинь = инициаль (23 штуки, напр. b, p, m, f) + финаль (24 штуки, напр. a, o, e, ai) + тон (4 + нейтральный), и их можно разделить для обучения и индексации. Hanyu Pinyin — официальная система романизации КНР, опубликованная в 1958 году. Более старые или альтернативные системы включают Wade-Giles (напр. Beijing как «Pei-ching»), почтовую романизацию («Peking») и Чжуинь/Бопомофо (ㄅ ㄆ ㄇ ㄈ), используемые на Тайване. Они всё ещё встречаются в именах собственных, исторических документах и традиционных изданиях, но повседневное использование доминирует за Hanyu Pinyin.

  • Используется стратегия «словарь в первую очередь, запасной вариант — одиночный иероглиф»: чтения многозначных иероглифов ищутся по слову, затем для одиночных символов подставляется наиболее частое чтение.
  • pinyin-pro содержит сотни тысяч словарных записей, покрывающих случаи многозначных иероглифов для подавляющего большинства повседневной лексики.
  • Знаки тонов (a) наиболее читабельны; номера тонов (a1) удобнее для хранения и передачи — две формы можно конвертировать друг в друга.
  • Правила перестановки тонов для «yi» и «bu», а также эрхуизация (ретрофлексия) и нейтральный тон применяются автоматически по фонетическим правилам точнее, чем простая табличная подстановка.
  • Пиньинь можно разделить на инициаль + финаль + тон для поддержки различных сценариев: аннотация, поисковая индексация и обучение.
  • Hanyu Pinyin, Wade-Giles и Чжуинь — разные системы романизации из разных периодов и регионов; они не взаимозаменяемы.

Примеры

Знаки тонов

Вход:   中国 (два иероглифа)
Режим:    знаки тонов (диакритика)
Выход:  zhōng guó
Применение:     печатные материалы, слайды, учебники

Цифры тонов

Вход:   中国 (два иероглифа)
Режим:    цифры тонов
Выход:  zhong1 guo2
Применение:     системы простого текста, не поддерживающие комбинируемую диакритику

Разрешение полифонов

Вход:   银行 (банк) / 行走 (идти)
Режим:    знаки тонов, приоритет словарного поиска
Выход:  yín háng  /  xíng zǒu
Примечание:    иероглиф 行 читается как xíng в 行走, но háng в 银行; инструмент использует контекст слова для выбора правильного чтения

Верхний регистр с пользовательским разделителем

Вход:   北京欢迎你 (Пекин приветствует тебя)
Режим:    верхний регистр, разделитель = "-"
Выход:  BEI-JING-HUAN-YING-NI
Применение:     URL-слаги, имена файлов, словарные списки для занятий

Часто задаваемые вопросы

Конвертирует упрощённый или традиционный китайский?

Оба. Страница принимает любую форму и выводит ханьюй пиньинь. Многозначные иероглифы (多音字) вроде 重, 长, 行, 着 различаются по словарю фраз, поэтому 银行 → yín háng (банк), 行走 → xíng zǒu (идти), а не наоборот.

Как отмечаются тона?

Доступно три стиля: знаки тонов (zhōng wén), цифры (zhong1 wen2) и без тонов (zhong wen). По умолчанию — знаки тонов; переключайтесь на цифры для систем, не отображающих диакритику, или на «без тонов» для романизированных поисковых ключевых слов.

А как же нейтральный тон (轻声)?

Слова с нейтральным тоном вроде 妈妈, 桌子, 漂亮 выводятся без знака тона на втором слоге (māma, zhuōzi, piàoliang). Это соответствует материковому китайскому стандарту произношения. Тайваньская разметка тоном-5 доступна как опция.

Корректно ли обрабатываются собственные имена?

Распространённые фамилии и топонимы есть в словаре. Менее распространённые имена с иероглифами, меняющими тон (например, 区 как Ōu или qū, 单 как Shàn или dān), могут получить неправильное чтение — проверяйте после конверсии. Иностранные имена, транслитерированные на китайский (например, 史密斯), читаются по иероглифам.

Применяются ли правила сандхи тонов?

Базовое сандхи — третий тон перед третьим становится вторым+третьим (你好 → níhǎo) — применяется при включении опции. Большинство других случаев сандхи (изменения 一 / 不 / 七 / 八) сильнее зависят от контекста, и страница оставляет исходный знак тона видимым, чтобы не скрывать структуру.

Можно ли конвертировать пиньинь обратно в иероглифы?

Надёжно — нет. Пиньинь-в-ханьцзы крайне неоднозначен (zhi может быть 之/只/直/止/止…), и это работа метода ввода, а не конвертера. Для такого направления используйте настоящий IME или ИИ-генератор текста.

Загружается ли текст на сервер?

Нет. Конверсия использует встроенный словарь и работает локально. Вставленный текст не покидает ваш браузер.

Похожие инструменты

Инструмент преобразования китайского

Бесплатный онлайн-конвертер китайского письма между упрощённым и традиционным. Учитывает различия в лексике материкового Китая, Тайваня и Гонконга при переводе.

Инструмент подсчета слов

Бесплатный онлайн-счётчик символов, слов, абзацев и времени чтения в реальном времени. Незаменимый помощник при написании статей, эссе и постов для соцсетей.

Конвертер регистра

Бесплатный онлайн-конвертер регистра: camelCase, snake_case, kebab-case, CONSTANT и другие форматы. Незаменим для разработчиков при переименовании переменных.

Конвертер Unicode

Бесплатный онлайн-конвертер Unicode с поддержкой форматов \uXXXX, &#xXXXX; и других. Удобно работать с интернационализированным текстом и кодировками.

Анализатор частоты символов

Бесплатный онлайн-инструмент частотного анализа символов. Подсчёт количества и частоты каждого символа с настройками регистра и пробелов.

Инструмент реверса строки

Бесплатный онлайн-инструмент для разворота строки: целиком, по словам или по строкам. Удобная обработка текста для самых разных задач прямо в браузере.