Поскольку слов в списке немного, то при работе качественного классификатора не все возможные ореольные группы будут образованы, то есть часть выходов классификатора окажется пустой.
Приведем только те из них, которые заполнены словами.
1. Хорошее, сильное, быстрое: первенство, почин, прима, состязание, чемпион.
2. Хорошее, сильное: идея (С), материализм, начало (С), право, премьер, премьера, принцип, приоритет, природа, социализм, явление (С).
3. Хорошее, быстрое: первоклассник.
4. Сильное: металлургия.
5. Сильное, медленное: база (С), основа (С), основание (С), причина, стержень, философия (П).
6. Медленное: введение.
7. Плохое, сильное: царь (С).
8. Плохое: понедельник.
9. Нейтральная группа: вещество (С), корень (С), передняя, подход, постулат (С), появление, предпосылка, приход (С), прототип, существо (С), январь.
Как мы помним, трехуровневый классификатор имеет 27 выходов, здесь заполнено только 9. На некоторых оказалось по одному слову, другие собрали группы слов. Выходы с одиночными словами в данном случае выполняют «отсекающую» функцию: они выделяют слова, семантически наименее связанные с основной массой слов списка. Действительно, каждое из слов, попавших на выходы 3, 4, 6, 7 и 8, семантически специфично. Нейтральная группа (выход 9) похожа на кладовку — туда сваливают без разбора ненужные до поры до времени вещи. Для компьютера особенно важны группы слов, собравшиеся на значимых (не нейтральных) выходах классификатора. Именно эти группы — рабочий лексико-семан-тический фонд компьютера. Это как бы речевые ячейки языкового «сознания» машины. В них она ищет синонимические замены, с помощью слов этих, групп может выражать наиболее тонкие семантические оттенки в своей речи.
Обратите внимание на 1-ю группу — слова в ней подобраны на удивление точно и с явным эффектом «понимания» их смысла. То же самое наблюдается во 2-й и 5-й группах. Особенно тесна смысловая связь между словами 5-й, «философской», группы: это буквально набор контекстуальных синонимов, которые вполне могут встретиться как лексические варианты в конкретном тексте.
Три уровня качественной классификации — это, конечно, очень мало для практической работы компьютера с полученными группами, но возможности такой работы просматриваются уже и здесь. Скажем, на вопрос, чем является для науки философия, компьютер «самостоятельно» мог бы ответить, что это база, основа, основание науки. В своем ответе компьютер учел все три аспекта семантики — понятийный, поскольку слова взяты из одной понятийной группы, качественно-признаковый, поскольку синонимы подыскивались в группе слов с общими качественными ореолами, и, наконец, фоносемантический, так как из группы выбраны слова с индексом С — наиболее точные и выразительные.
А если спросить компьютер, какое понятие он может противопоставить социализму, он ответит: «Социализм и царь противостоят друг другу как совершенно несовместимые понятия». В этом случае компьютер «рассуждал» так: слово социализм находится в группе, образовавшейся на выходе «хорошее и сильное», этому выходу противопоставлен тот, который собрал «плохие и сильные» слова, а это выход 7, где помещено слово царь; значит, социализм и царь в данном случае оценочно противопоставлены.
Ясно, что при работе с большими массивами слов и с использованием многоуровневых классификаторов семантические имитационные возможности компьютера резко возрастут.
Что же необходимо для того, чтобы уже сейчас пустить в работу описанную здесь систему комплексного анализа лексической семантики?
Прежде всего нужно развить и усовершенствовать «понятийный классификатор», то есть как бы в развитие программной основы «Русского семантического словаря» разработать специальную автоматизированную систему семантического анализа, ориентированную на работу с понятийной семантикой. Но, как уже говорилось, проблем на этом сложном пути еще много.
Кроме того, необходим, остро необходим словарь русских качественных ореолов. Лучше всего было бы издать общий словарь русской ореольной семантики, но его фоносемантическая часть готова, тогда как качественно-ореольной нет и в ближайшее время не ожидается. А без учета качественно-признаковых ореолов невозможно построить систему полноценного семантического анализа.
Как же быть? Неужели положение так безвыходно?
Думается, что выход, по крайней мере, как временное решение проблемы, есть. Можно использовать удивительно рациональное устройство языковой семантики, когда семантические аспекты своим взаимопроникновением поддерживают друг друга. Как уже отмечалось, фоносемантический ореол слова часто соответствует качественному, иногда настолько полно, что набор фоносемантических признаков буквально повторяет набор признаков, характеризующих качественный ореол. В таких случаях, открывается возможность, которой неосмотрительно было бы не воспользоваться: результаты компьютерного расчета фоносемантики слова можно одновременно считать результатами измерения его качественного ореола.
Читать дальше