Онтология
как основной результат деятельности
Любая деятельность состоит из отдельных операций, устанавливающих связи между объектами фиксированной предметной области. Деятель (далее традиционно будем называть его пользователем) раз за разом – пишет ли он научную статью, заполняет ли таблицу данными, составляет ли график работы – выполняет вполне стандартный набор операций, приводящих в конечном счете к достижению фиксированного результата. И в этом результате он видит смысл своей деятельности. Но если посмотреть с позиции не локально утилитарной, а системно глобальной, то основная ценность работы любого профессионала заключается не в очередной статье, а в методе ее написания, в онтологии деятельности. То есть вторым основным принципом семантической сети (после вывода «онтологий должно быть неограниченное множество; сколько деятельностей, столько и онтологий») – должен быть тезис: смысл любой деятельности заключается не в конечном продукте, а в онтологии, зафиксированной в ходе ее реализации .
Конечно, сам продукт, скажем, статья, содержит в себе онтологию – она, по сути, и есть воплощенная в тексте онтология, но в таком застывшем виде продукт очень сложно поддается онтологическому анализу. Именно об этот камень – фиксированный конечный продукт деятельности – и обламывает себе зубы семантический подход. Но ведь должно быть понятно, что выявить семантику (онтологию) текста можно только уже обладая онтологией этого конкретного текста. Понять текст с чуть отличающейся онтологией (с измененной терминологией, понятийной сеткой) даже человеку сложно, а программе и подавно не по силам. Однако, как ясно из предложенного подхода, анализировать семантику текста и не надо: если перед нами стоит задача выявить некую онтологию, то нет необходимости анализировать фиксированный продукт, нужно обратиться непосредственно к самой деятельности, в ходе которой он появился.
По сути, это означает, что надо создать программную среду, которая одновременно была бы и рабочим инструментом пользователя-профессионала, и онтологическим парсером, фиксирующим все его действия. От пользователя не требуется ничего большего, чем просто работать: составлять план текста, редактировать его, осуществлять поиск по источникам, выделять цитаты, помещать их в соответствующие разделы, делать сноски и комментарии, организовывать индекс и тезаурус и пр., и пр. Максимум дополнительных действий – так это помечать новые термины и по контекстному меню привязывать их к онтологии. Хотя любой профессионал будет только рад этой дополнительной «нагрузке». То есть задача вполне конкретна: надо создать такой инструмент для профессионала любой области, от которого он не смог бы отказаться , инструмент, не только позволяющий выполнять все стандартные операции по работе со всевозможной информацией (сбор, обработка, конфигурирование), но и автоматически формализирующий деятельность, строящий онтологию деятельности, а при накоплении «опыта» корректирующий ее.
Универсум объектов и кластерные онтологии
Понятно, что описываемый подход к построению семантической сети будет по-настоящему эффективным только в случае выполнения третьего принципа: программной совместимости всех создаваемых онтологий, то есть обеспечения их системной связанности. Безусловно, каждый пользователь, каждый профессионал создает свою онтологию и работает в ее среде, но совместимость индивидуальных онтологий по данным и по идеологии организации обеспечит создание единого универсума объектов (данных).
Автоматическое сравнение индивидуальных онтологий позволит, выявляя их пересечения, создавать тематические кластерные онтологии – иерархически организованные неиндивидуальные структуры объектов. Взаимодействие индивидуальной онтологии с кластерной позволит существенно упростить деятельность пользователя, направлять и корректировать ее.
Существенным требованием семантической сети должно являться обеспечение уникальности объектов, без чего невозможно реализовать связанность индивидуальных онтологий. К примеру, любой текст должен находиться в системе в единственном экземпляре – тогда каждая ссылка на него, каждое цитирование будет фиксироваться: пользователь может отследить включенность текста и его фрагментов в те или иные кластеры или персональные онтологии. При этом понятно, что под «единственным экземпляром» понимается не хранение на одном сервере, а присвоение объекту уникального идентификатора, не зависящего от места расположения. То есть должен быть реализован принцип конечности объема уникальных объектов при множественности и неконечности их организации в онтологии.
Читать дальше