— на базе фрейма, содержащего все места, которые посещает субъект, с перечнем его возможных действий;
— поиск в хранящихся текстах предложений, содержащих в себе вопрос или большую часть вопроса, и объединение их в текст ответа с учетом синтаксиса языка. В данном случае системе совсем необязательно уметь анализировать текст и понимать, что такое «война», и знать, что она началась, — это должен знать тот, кто задал вопрос. Главное, чтобы субъект, задающий вопрос, был удовлетворен ответом. На данном уровне важнейшей задачей является задача определения расстояния не только между различными текстами (в этой части достаточно существующих решений), но и между неизвестным вопросом и известным ответом, который и должен быть поставлен в соответствие этому вопросу.
Для определения индивидуального стиля поведения (разговора) виртуальному специалисту вполне подойдут адаптированные к текстам естественного языка алгоритмы самообучения на базе гибели и рождения элементов [32] Расторгуев С.П. Философия информационной войны. М.: МПСИ, 2002.
. В магистерской диссертации Р.С. Токарева (МФТИ, 2009 г.) было показано, что для решения данной задачи вполне достаточно всего четырех видов элементов с такими базовыми операциями, как удалить слово, добавить слово, заменить слово, переставить слова.
На втором уровне у системы имеются правила пополнения текстов и правила исключения отдельных фрагментов текста. Здесь возможны два пути модификации исходных текстов:
— их действительная модификация (включение/исключение);
— расширение (сужение) для информационной системы возможностей по доступу к текстам, принадлежащим другим информационным системам.
Наличие подобных правил может стать основой механизма самообучения, т. к. при определенных условиях эти правила задают направление развития информационной системы. Все ответы готовятся на базе различных текстов. Неоднократная отрицательная оценка ответа различными собеседниками является достаточным основанием для удаления текста, понижения его статуса. Положительная оценка приводит к повышению статуса текста, что, в итоге, способствует его выбору в случае наличия конкуренции среди текстов, претендующих на роль генератора ответа.
На третьем уровне при ответе на вопрос система должна уметь оперировать историей вопросов-ответов. Например, отвечая на вопрос «Согласны?», система должна уметь посмотреть историю диалога и расширить вопрос текстами о том, с чем предполагается согласиться. Как глубоко уходить в историю, на сколько шагов, определяется собеседником. В случае рядовой беседы людей друг с другом ими обычно учитываются от 3 до 7 последних высказываний.
Повышению эффективности функционирования системы на третьем уровне может способствовать карта взаимосвязи текстов, страниц сайтов, состоящая из матрицы следования текстов (вопросов/ответов друг за другом) и матрицы расстояний между текстами.
На четвертом уровне система должна иметь не только тексты, на базе которых строится ответ, но и информацию о конкретном субъекте, являющемся источником вопросов-сообщений, о цели и правилах общения. Четвертый уровень предполагает возможность интимного общения, опирающегося на знания о собеседнике. Четвертый уровень хотя бы без частичного знания системы предпочтений собеседника невозможен. Знания о собеседнике могут быть собраны информационной системой (виртуальным специалистом) в процессе регулярных бесед с собеседником. Эти знания представляются в виде соответствующей модели, которая позволяет рассчитывать такие характеристики, как:
— отношение собеседника к данному виртуальному специалисту. Отношение можно попытаться оценить через время беседы, через число положительных оценок, выставленных собеседником виртуальному специалисту за беседу, через число непосредственных обращений;
— интересы собеседника. Интересы формируются на базе частотного словаря употребления ключевых слов — это и есть интересуемые проблемы;
— отношение к интересующим проблемам. Это отношение формируется путем сбора данных об эмоциональной окраске речи собеседника применительно к интересующим проблемам;
— адекватность собеседника, в том числе истинность или ложность его текстов. Подобное возможно, если собирать оценки других посетителей на высказывания виртуального специалиста, которым его научил конкретный собеседник.
На пятом уровне система должна уметь оценивать истинность или ложность того или иного сообщения, в том числе с учетом того, кто автор этого сообщения. Умение оценивать истинность или ложность предполагает наличие памяти о происходящем, о том, чем закончилось то или иное высказывание.
Читать дальше