– воспринимает слова в любой их форме, и возможности отменить процесс образования производных от исходного слова нет. Причем, не работают ни стандартный для поисковой машины Яндекс оператор «!», находящийся перед словом, ни заключение запроса в двойные кавычки;
– не проводит различий между заглавной и прописной буквами в тексте;
– ищет по целому слову, изменяя его, по фрагменту слова поиск не выполняется;
– не поддерживает функцию принудительного включения слова в результат поиска. Если из двух слов, соединенных логическим «И» в пределах текста есть только одно, этот документ все равно попадет в выдачу, даже если перед обоими словами стоит знак «плюс»;
– оператор логическое «И» внутри одного предложения («&») при этом действует;
– оператор расстояния между словами не действует;
– логическое «НЕ» существует, но всегда относится ко всему тексту (что соответствует двойной тильде «~~»);
– точная фраза (оператор «кавычки») действует;
– логическое «ИЛИ» также действует.
Коперник Десктоп:
– выдает результат в зависимости от того, с заглавной или прописной буквы написано слово. Эта зависимость исчезает, если перед словом поставить логическое «ИЛИ» (оператор OR – заглавными буквами);
– ищет информацию по фрагменту слова;
– словоформы не поддерживает. Если нужно любое производное от искомого понятия, надо написать его не до конца, чтобы все варианты окончаний могли быть добавлены к этому фрагменту;
– если в запросе два слова связаны логтческим «И», представляет в выдаче только те тексты, в которых обязательно есть оба слова (напоминаем, что лучше писать слово без окончания, если нет уверенности в том, в какой форме оно присутствует в тексте);
– логическое «НЕ» представляет знаком «минус», действие которого распространяется на любой фрагмент текста.
Мониторинг изменений на сайтах в Интернете
Ни специалисту конкурентной разведки, ни сотруднику отдела маркетинга или сбыта недостаточно просто знать, на какой страничке Интернета содержится нужная информация. Надо иметь возможность своевременно и точно отслеживать изменения на этой страничке. Каждый может себе представить, насколько сложна, а чаще всего и вовсе неосуществима эта задача. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте – скажем, в прайс-листе, – занимающем пять страниц.
Для решения подобной проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые «сторожевые роботы»: ознакомившись со страницей, они сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают актуальное состояние ресурса с этим образом. Программа отмечает изменившиеся места, которые становятся похожи на выделенные маркером фрагменты текста на бумажном носителе. Более того, удаленние кусков материала также фиксируется многими программами данной категории – как правило, внизу страницы, дабы не мешать восприятию человеком информации. «Сторожевые роботы» могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.
Предлагаем рассмотреть эти программы более подробно.
Сторожевой робот WebSite-Watcher
Программа выпущена в Германии, ее официальный сайт – http://www.aignes.com. Стоимость продукта составляет около 40 долл. США за индивидуальную лицензию. Кроме того, пользователю дается 30-дневная полнофункциональная версия, дабы он успел удостовериться в необходимости ему этого продукта. Заплатить за WebSite-Watcher требуется лишь один раз, после чего все обновления становятся доступны бесплатно и на неограниченный срок.
Интерфейс программы поддерживает русский и украинский языки, однако раздел «Помощь» до выхода в свет версии 4.06 был написан на английском. После появления версии 4.06 на сайте программы по адресу http://www.aignes. com/wswtrans.htm стал доступен exe-файл (wswhelp_russian.exe), который присоединяет к WebSite-Watcher справочную информацию на русском языке. Работа с русским языком не вызывает у программы никаких проблем. Продукт довольно часто обновляется. Так, на момент написания книги была доступна версия 4.10.
WebSite-Watcher работает как клиент на компьютере пользователя. Это значит, что все закладки и конфигурации хранятся локально на жестком диске компьютера и сервер хозяина не участвует в процессе поиска. Производитель утверждает, что выход в Интернет требуется продукту лишь для посещения страниц, проверяемых пользователем.
Читать дальше
Конец ознакомительного отрывка
Купить книгу