За несколько тысяч лет хитроумные китайцы успели довести количество иероглифов до 50000 с хвостиком. И хотя число нужных в повседневной жизни знаков не измеряется десятками тысяч, все равно, как ни крути, стандартный набор старой типографии — 9000 литер.

Долгое время набор осуществлялся по принципу «на каждый иероглиф — отдельный печатный элемент». Поэтому работать приходилось с машинками-монстрами вроде этой:

Основной ее элемент — банк иероглифов, находящихся на чернильной подушке. Над иероглифами закреплена механическая система: рукоятка, «лапка» для захвата и бобина с листом бумаги. Весь механизм вместе с бобиной вслед за рукояткой способен перемещаться влево, вправо, вперёд и назад за счет усилия машиниста. Чтобы набрать текст, машинист долго ищет с лупой нужный иероглиф, помещает над ним систему и нажатием на ручку приводит в действие «лапку», которая хватает иероглиф и на ходу, разворачивая, отпечатывает его на листе бумаги. При этом бобина с листом немного проворачивается, предоставляя место для следующего символа. Разумеется, процесс печати на таком агрегате выходит крайне медленным — опытный оператор мог набирать не более 11 иероглифов в минуту.

В 1946 году известный китайский филолог Линь Юйтан предложил вариант печатной машинки, построенной на совершенно новом принципе — разложении иероглифов на составные части.

Электромеханическая печатная машинка Линь Юйтана, 1946 г.

В отличие от габаритных предшественниц, новая машинка была ничуть не больше своих латинских аналогов, да и клавиш на ней было немного. Дело в том, что клавиши соответствовали не иероглифам, а их составным частям. В центре устройства находился «волшебный глаз»: когда машинист нажимал комбинацию клавиш, в «глазе» появлялся вариант иероглифа. Чтобы подтвердить выбор, нужно было нажать дополнительный функциональный ключ. При наличии всего 64 клавиш такая машинка легко могла обеспечить набор 90,000 знаков и скорость 50 знаков в минуту!

ЧИТАЙТЕ ТАКЖЕ:  18 случайных научных изобретений и открытий, изменивших мир

Хотя Линь Юйтан умудрился получить на свое изобретение патент в США, в массы оно так и не пошло. Неудивительно, ведь производство одного такого аппарата стоило на тот момент порядка 120,000 долларов. К тому же в день, когда была назначена презентация для компании «Ремингтон», машинка отказалась работать — даже волшебный глаз не помог. Идею благополучно отложили до лучших времен.

Зато в эру широкого распространения компьютеров идея Линь Юйтана о разложении иероглифов на составные части обрела новую жизнь. Она легла в основу структурных методов ввода китайских иероглифов, о которых мы сейчас и поговорим. (Кстати, в 80-е годы тайваньская компания MiTAC даже разработала непосредственно на основании системы кодирования Линь Юйтана свой метод структурного ввода — Simplex.)

Таких методов известно не меньше десятка, и все они основаны на графической структуре иероглифа. Китайские иероглифы — это пазлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается.

Один из самых распространенных методов структурного ввода — уби цзысин (Wubing zixing — «ввод по пяти чертам»). Как же он работает? Сразу предупреждаю: сложно.

На самом деле все китайские иероглифы делятся на четыре группы:

Базовые 5 черт (一, 丨, 丿, 丶, 乙) и еще 25 очень часто употребляемых иероглифов (каждому из них сопоставлена клавиша). Иероглифы, между графемами которых есть определённое расстояние. Например, иероглиф 苗 состоит из графем 艹 и 田, между которыми есть расстояние (хотя на печати они немного «спрессовываются» и вам может показаться, что расстояния между ними нет).

ЧИТАЙТЕ ТАКЖЕ:  Быстрый способ изучения английского

Иероглифы, графемы которых соединены друг с другом. Так, иероглиф 且 представляет собой графему月, соединённую с горизонтальной чертой; 尺 состоит из графемы 尸 и откидной черты.

Иероглифы, графемы которых пересекаются либо накладываются друг на друга. Например, иероглиф 本 — это пересечение графем 木 и 一.

На первый взгляд может показаться, что графемы на клавиатуре расположены беспорядочно. На самом деле это не так. Клавиатура разбита на пять зон, по числу базовых черт, (на рисунке они отмечены разными цветами). Внутри каждой зоны клавиши пронумерованы — от центра клавиатуры к краям. Номер составляется из двух цифр от 1 до 5 — в зависимости о того, из каких базовых черт собирается графема.

Таким образом, 毅=U+E+M+C. Для ввода иероглифов, состоящих более чем из четырёх графем, нужно ввести первые три графемы и последнюю. Поскольку графем очень много, то неизбежно появятся несколько иероглифов, претендующих на одну и ту же комбинацию клавиш. Тогда приходится перебирать варианты, но компьютер умный он по смыслу старается первыми подсовывать наиболее подходящие по смыслу графемы.

Такая раскладка далеко не единственная, но одна из самых популярных. Она хоть и довольно сложна для изучения, но зато открывает возможность слепого ввода, что повышает максимальную скорость набора до 160 иероглифов в минуту — это около 500 нажатий клавиш за ту же минуту!