Подробное освещение классификационных и дескрипторных ИПЯ, информационно-поисковых тезаурусов и лингвистических (т. е. языковых) аспектов автоматизированных ИПС объясняется тем, что они оказывают решающее влияние на функционирование ИПС. Какой бы мощной и современной ЭВМ мы ни располагали, без правильно выбранного поискового языка вся система будет работать неэффективно.
Совершенствование ИПЯ во многой зависит от достижении в области теории семантической информации и направлений лингвистики. Поэтому появление автоматизированных ИПС послужило толчком к интенсивным исследованиям в области этих наук. Очень заманчиво, например, поручить вычислительной машине такую трудоемкую операцию, как реферирование документов. Одним из способов реализации этой идеи является выделение машиной в тексте таких предложений, которые содержат наиболее значимые для данной области знаний термины (а таковыми являются дескрипторы тезауруса этой области знаний, который хранится в памяти машины). Из этих предложений формируется реферат документа.
Другой, более сложный путь состоит в синтезе самих предложений после выделения в тексте наиболее значимых терминов. Все это требует от ЭВМ обширных «познаний» в области лингвистики. Решение все новых и новых проблем теоретической и прикладной лингвистики имеет конечной целью улучшение «взаимопонимания» между человеком и ЭВМ, а следовательно, и более полное использование возможностей вычислительной техники.
В последнее время в информатике прочно утвердился термин «лингвистическое обеспечение», который обобщает все те проблемы лингвистического характера, которые необходимо решить для обеспечения деятельности автоматизированных информационно-поисковых систем. Лингвистическое обеспечение — необходимый и очень важный элемент любой автоматизированной ИПС.
И проблемы технические
Вычислительные машины не сразу нашли широкое применение в информационном поиске. Причиной этому послужила высокая стоимость и низкая эффективность работы первых ИПС. Однако такое положение длилось не долго. Прогресс вычислительной техники сделал применение ЭВМ к поиску научной информации не только целесообразным с точки зрения эффективности поиска, но и выгодным экономически.
Автоматизированные ИПС (АИПС), реализованные на ЭВМ, появились на рубеже 60-х годов. Уже в 1961 г., по данным Центра по обработке научной информации Евратома, из 121 ИПС, созданных в разных странах мира, 16 были реализованы на ЭВМ. За прошедшие годы число АИПС неизмеримо возросло. Стремительным был и качественный рост АИПС, обусловленный с одной стороны, быстрым совершенствованием технических средств, с другой — развитием теоретических работ в области информатики.
Роль технических средств в обработке научной информации настолько велика, что само становление и развитие информатики связывают с ходом работ по механизации и автоматизации процессов обработки информации. В развитии информатики в связи с этим можно проследить три периода.
Первый период (1950-е годы) связан с первоначальными исследованиями и опытно-конструкторскими разработками, получившими широкое признание и заложившими здание современной информатики.
В течение второго периода (1960-е годы) в широких масштабах началось промышленное внедрение АИПС. К концу периода потребителей обслуживали сотни крупных информационных систем различных типов.
В настоящее время мы переживаем третий период развития информатики. В чем же его особенность?
Уже к концу 1960-х годов стала очевидной малая экономичность большого числа независимых (автономных) информационных систем, зачастую обрабатывающих сходными методами одну и ту же информацию для решения сходных задач Продолжающийся рост объемов информационных массивов требовал дальнейшего снижения себестоимости информационных процессов.
В поисках решения возникших проблем выяснилось, что гораздо экономичнее хранить документ в памяти ЭВМ как бы разобранным на отдельные фрагменты и при необходимости предоставлять эти фрагменты потребителю в самых разнообразных и удобных для него сочетаниях.
Информационная система, построенная по такому принципу, фактически объединяет, интегрирует в себе сразу несколько информационных систем, предназначенных для выполнения только определенной функции.
Системы, которые при однократной исчерпывающей обработке документальных источников научной информации и однократном вводе результатов этой обработки в машину в дальнейшем позволяют многократно использовать эту информацию для решения самых разнообразных задач, называются интегральными информационными системами (ИИС) К задачам, решаемым с помощью ИИС, относятся:
Читать дальше