Иначе говоря, ассоциативные эксперименты подтверждают гипотезу о словоформе как основной единице перцептивного словаря.
Как отмечалось во вступительном разделе статьи, есть основания полагать, что единицей перцептивного словаря выступает не просто словоформа, а словоформа фонетическая. Очевидное возражение против признания фонетического слова основной единицей перцептивного словаря состоит в чрезмерном увеличении объема словаря; ясно, что каждое слово (словоформа) может употребляться с разными проклитиками и энклитиками, – отсюда, в пределе, разрастание словаря во столько раз, сколько клитик и их сочетаний существует в языке (если не принимать во внимание, разумеется, частеречные и иные ограничения). Учитывая, однако, преимущественно эмпирический характер проблемы, авторы, опираясь на реальный корпус русского языка, созданный в процессе работы над проектом, получили точные количественные данные по соотношению фонетических слов текста, единиц словаря, состоящего из фонетических слов, и словаря словоформ. Как оказалось, словарь фонетических слов, хотя и превышает, разумеется, по объему словарь словоформ, но далеко не достигает при этом теоретического предела, о котором сказано выше: реальное возрастание объема – всего 30%. Говоря о фонетических словах, следует учитывать существенную с точки зрения восприятия речи неоднородность этого класса единиц. Есть фонетические слова, совпадающие со словами (словоформами), которые «в любом случае» входят в перцептивный словарь, и есть фонетические слова, не совпадающие со словами – единицами словаря. Примером первых может служить фонетическое слово НАРОД (НА РОД и НАРОД, точнее, НА РОТ и НАРОТ), примером вторых – КНИМУ (К НЕМУ). По-видимому, существование именно первого типа фонетических слов считается особенно серьезной «помехой» для оперирования фонетическими словами как особыми единицами ввиду их очевидной неоднозначности. Однако наши исследования показывают, что важность данной проблемы не следует преувеличивать. Во-первых, экспериментально было не раз показано, что носители языка не различают, вне лексического и грамматического контекста, единицы типа НАРОД / НА РОД. Модель восприятия речи, претендующая на адекватное воспроизведение структуры соответствующих механизмов человека и их функционирования, не может быть «лучше» своего естественного прототипа: то, что не различает человек, не должна различать и имитирующая его поведение модель. Во-вторых, значимость подобных пар не следует переоценивать еще и потому, что их представленность в тексте и словаре, построенном на базе фонетических слов, весьма невелика. В нашем словаре фонетических слов, составленном на основе сформированного корпуса русского языка, фонетические слова класса НАРОД (НАРОТ) составили всего 0,5% от общего числа фонетических слов. Одновременно можно отметить, что в раде случаев различению членов пар типа НАРОД / НА РОД способствует несовпадающая частотность; так, в наших текстах число вхождений местоименной словоформы с предлогом ПО ЭТОМУ составляет 9 единиц, а слова ПОЭТОМУ – 81. Но никакой системы здесь, как и можно было ожидать, не наблюдается.
Итак, с одной стороны, организацию перцептивного словаря как словаря фонетических слов едва ли следует рассматривать как заведомо нереалистичную постановку проблемы. Его объем (на нашем материале около 85 000 единиц), конечно же, никоим образом не перегружает человеческую память.
«Выгодность» такого словаря заключается, несомненно, в том, что процесс идентификации единиц текста здесь во многом сводится к процедуре их прямого сличения с единицами словаря, «наложения» первых на вторые (разумеется, с учетом всех процедур построения когорты и ее дальнейшей фильтрации). С другой стороны, из изложенного выше, по-видимому, следует, что фонетические слова в словаре представлены скорее косвенно – как словоформы, омонимичные сочетаниям словоформ и их клитик. Омонимичность разрешается путем обращения к высшим языковым уровням, к контексту. Там, где омонимичность не представлена, применяется стандартный алгоритм обращения к словарю, где, в числе прочих единиц, присутствуют и клитики, так что возможность / невозможность членения фонетического слова выступает как частный случай выбора между словами-кандидатами. Является при этом членимая последовательность фонетическим словом, отличным от слова семантико-грамматического, или нет, оказывается, вообще говоря, несущественным; фонетическое слово, определяемое акцентным контуром, выступает как промежуточный продукт, с которым работает алгоритм сегментации / идентификации.
Читать дальше
Конец ознакомительного отрывка
Купить книгу