А если говорить о моих недоказуемых верованиях, то вот еще одно: основной сферой исследований психологии и социологии для нескольких следующих поколений станет исследование генетических компонентов поведения в рамках иерархии, групповых верований и клановой идентификации, приводящей к межклановой враждебности. Скоро мы окончательно убедимся в том, что устранить или контролировать эти «негативные» аспекты человеческой природы невозможно, не теряя при этом других качеств, которые нам нравятся, – например, способности к творчеству. Если эта печальная догадка верна, то ради выживания нам следует создавать общества, предлагающие большое разнообразие путей к успеху и множество переплетающихся кланов и иерархий, чтобы каждый мог стать победителем, в самых разных контекстах. В этой связи американский эксперимент оказался самым успешным: американское общество действительно предлагает подобное разнообразие. Виртуальные миры постсимволической коммуникации смогут обеспечить высший уровень разнообразия, соответствующий психологическому наследию нашего вида, которое я считаю довольно опасным.
Еще я верю, что в будущем мы наверняка преодолеем кризис программного обеспечения. Чтобы дети смогли создавать целостные существа с той же легкостью, с какой сегодня они произносят предложения, потребуется программное обеспечение, надежное, гибкое, восприимчивое и при этом свободное от ограничивающих предубеждений (которые были бы просто возрождением символизма). Можно ли создать такое программное обеспечение? И опять вопрос, верю ли я! Я думаю, что можно, но это случится не скоро. Сегодня нам известны всего два примера такого программного обеспечения: эволюция и мозг. И то и другое действует весьма эффективно, так почему бы не создать еще что-нибудь подобное?
Марти Херст – адъюнкт-профессор Школы информационного менеджмента и систем Калифорнийского университета в Беркли, сотрудник подразделения компьютерных наук. Ее основные научные интересы – пользовательский интерфейс и использование зрительных образов для поиска информации, эмпирическая вычислительная лингвистика и интеллектуальный анализ данных.
Я верю, что проблема поиска разрешима. Достижения в сферах компьютерной лингвистики и разработки пользовательского интерфейса в конце концов позволят нам находить ответы на любые вопросы, при условии что ответы закодированы в форме текста и хранятся в открытых источниках. Достижения в создании разумных систем позволят строить умозаключения, способные находить ответы даже в том случае, когда их нет в документах, хранящихся в открытых источниках.
Мои предположения подтверждают некоторые недавние достижения. Во-первых, компьютерная лингвистика (также ее называют обработкой естественных языков, или инжинирингом языков) в последние десятилетия достигла больших успехов прежде всего благодаря доступу к огромным массивам текста, что позволяет получать достоверные статистические данные. Например, современные системы компьютерного перевода почти полностью основаны на статистических паттернах, извлеченных из массивов текста; они действуют так же, как системы ручного перевода, и постоянно совершенствуются.
Компании, создающие поисковые машины, постоянно собирают данные о том, как люди ищут информацию. Эти поведенческие данные можно использовать для улучшения средств и инструментов поиска. Например, некоторые алгоритмы исправления грамматических ошибок основаны на данных о том, как люди исправляют ошибки, проверяя пары в последовательных запросах. Если второй запрос почти идентичен первому, считается, что пользователь просто исправил ошибку в слове. Затем создаются паттерны, позволяющие автоматически исправлять ошибки правописания.
Еще одно достижение компьютерной лингвистики – создание вручную огромных лексических онтологий, к которым впоследствии обращаются при формулировании аксиом и правил использования языка. Эти современные онтологии, в отличие от своих предшественниц, достаточно обширны, просты и потому полезны, хотя сегодня эта работа только началась. Также мы наблюдаем активные попытки автоматического создания таких онтологий на основании больших массивов текста. На мой взгляд, самый перспективный подход – объединить автоматизированный подход и создание онтологий вручную. (Я скептически отношусь к шумихе вокруг семантической сети: очень сложно описывать концепции систематическим образом, а тем более заставить всех, кто создает информацию, следовать единой схеме.)
Читать дальше
Конец ознакомительного отрывка
Купить книгу