<...> Результатом работы субмодуля является расстановка меток, соответствующих ударным слогам. <...>
Если в распоряжении системы имеются данные о составе цепочек сегментных единиц <...>, а также о местоположении ударных слогов, то необходима еще информация о членении речевого потока на слова, чтобы система могла обратиться к процедуре отождествления соответствующих цепочек с единицами словаря. Заметим сразу, что в языках с фиксированным ударением обнаружение ударных слогов естественным образом обеспечивает одновременно установление словесных границ <...>. Но и в языках с разноместным ударение, к которым принадлежит русский, выявление ударных слогов есть установление числа слов, что также содействует обнаружению словесных границ, особенно если учесть статистические закономерности местоположения ударного слога в слове.
<...> обратимся к механизмам словарного поиска.
Если словарь представить себе как некоторую упорядоченную совокупность словоформ (хотя это не очень реалистическая гипотеза <...>) и исходить из такой ситуации, когда фонемная цепочка, отвечающая слову, «заполнена» однозначно и без пропусков, то проблема словарного поиска решается тривиально. Идентификация данной цепочки, охарактеризованной просодически, в качестве экспонента некоторого слова (словоформы) реализуется в результате последовательного просмотра всего корпуса словаря. Как вполне понятно, такой процесс сплошного сканирования множества словарных единиц носит громоздкий характер. Процедуры этого типа, возможно, используются в ситуациях, когда распознаванию подлежат новые слова, а также слова, появление которых в данной точке речевой цепи характеризуется низкой вероятностью.
Более обычны ситуации, когда восприятие речи организуется встречной активностью субъекта восприятия. Использованию активных стратегий восприятия способствует то обстоятельство, что сам словарь пронизан множественными связями между его единицами – связями семантическими, грамматическими, фонетическими (фонологическими). Иначе говоря, упорядоченность словаря реализуется как наличие в его составе пересекающихся групп слов, каждая из которых объединена теми или иными признаками. Контекст речевого акта, установки слушающего, предтекст позволяют достаточно узко отграничить, прежде всего с семантической точки зрения, тот подсловарь, единицы которого слушающий «рассчитывает» встретить в воспринимаемом тексте. Поэтому сканирование, о котором говорилось выше, обычно осуществляется в рамках не всего словаря, а одного из подсловарей.
Меньший объем словаря (подсловаря) имеет одним из своих результатов снижение требований к точности и полноте описания входных единиц с фонетической (фонологической) точки зрения. В этих условиях и возникает возможность использования гиперпризнаков, понимаемых как признаки единиц супрафонемного формата, в типичном случае – слов. <...>
Любой подсловарь дополнительно стратифицирован в силу разной частотности входящих в него слов. Частотность слова также принадлежит к его гиперпризнакам.
Все используемые в процессе восприятия признаки (гиперпризнаки) иерархизированы за счет приписывания им определенных весов <...>. Поскольку идентификацию слов уместно понимать как активирование связей, принадлежащих ментальному лексикону, можно сказать, что признаки, которым отвечает меньший вес, достаточно часто вообще не используются: уровня активации, достигаемого за счет использования признаков высокого иерархического статуса (с большим весом), оказывается достаточно, чтобы имела место идентификация входной цепочки в качестве слова X.
Вес, приписываемый признаку, может носить постоянный и переменный характер. По-видимому, постоянно высокое значение весов свойственно тем признакам, которые отличает существенная помехоустойчивость. К последним принадлежат прежде всего просодические признаки. Частотность как таковую тоже представляется уместным отнести к признакам с высоким весовым значением, однако конкретное распределение слов по частотности будет зависеть от выбора подсловаря. В условиях шепотной речи, например, естественным будет снижение веса признака «звонкость/глухость», который в русском и в ряде других языков может фигурировать как гиперпризнак, характеризуя более или менее протяженные фонемные цепочки.
Можно предположить, что взаимодействие признаков (гиперпризнаков) в процессе лексического поиска формально описывается с помощью правил теории размытых, или нечетких, множеств <...>.
Читать дальше
Конец ознакомительного отрывка
Купить книгу