На этом уровне мы видим, какие подразделы содержатся в данном разделе. Цифры в скобках справа — количество сайтов в подразделе. Конечно, не все эти сайты впрямую посвящены Интернету.
В каталог сайты попадают только по заявке разработчика, который сам выбирает раздел, куда его поместить. Если в каталоге нет конкретного сайта, это означает лишь то, что его хозяин не подал заявку на размещение в каталоге ссылки на его сайт. К тому же регистрация в некоторых каталогах, в частности, в каталоге mail.ru— платная. Возможно, существует еще очень большое количество сайтов на эту тему, хозяева которых решили сэкономить на регистрации.
Перейдем по ссылке Введение в Интернет(рис. 2.3). Вначале как всегда — реклама. Сайты без номера попали сюда на правах рекламы за достаточно большие деньги.
Побродите по каталогу. Возможно, вы найдете для себя что-то неожиданное и интересное. Посмотрите другие каталоги. Сравните их с каталогом mail.ru.
Если вас интересует конкретный вопрос, то лучше обратиться к услугам поисковой машины (ПМ), или поисковой системы (ПС), или, попросту, к поисковику. Поисковик — это довольно сложная компьютерная программа, снабженная зачатками искусственного интеллекта и умеющая самостоятельно обучаться. Система круглосуточно, без выходных и перерывов на обед, сканирует Интернет. Она переходит по ссылке на страницу, находит там новые ссылки, переходит по ним далее и за какое-то время обходит всю сеть. Это время, несмотря на большую скорость работы программы, превышает месяц. Столь большой период обхода объясняется огромным количеством страниц и тем, что постоянно возникают новые страницы и сайты, а какие-то закрываются. Эта часть поисковика называется пауком.
Загрузив страницу, система анализирует ее. Она ищет так называемые ключевые слова, то есть слова, которые могут использовать пользователи при поиске информации. Информация о странице сохраняется в базе данных поисковика.
По запросу пользователя поисковик анализирует свою базу данных и выдает результат обработки запроса в виде списка ссылок на те страницы, где, возможно, существует ответ на вопрос, интересующий пользователя.
Например, мы хотим найти каталоги сайтов. Используем для этого поисковик. Один из популярнейших русскоязычных поисковиков — yandex.ru. Загрузите главную страницу этого сайта.
В центральной части страницы находится поле, предназначенное для ввода поисковых запросов. Как только мы начнем набирать каталог сайтов, программа станет предлагать нам готовые варианты запросов. С первой же буквы второго слова появится нужный вариант (рис. 2.4). Если по нему щелкнуть, то загрузится страница с результатом обработки нашего запроса (рис. 2.5).
Прежде всего, обратите внимание, что по нашему запросу нашлось 270 млн страниц, на которых присутствуют какие-либо каталоги сайтов.
На текущей странице приведен список из десяти сайтов с их кратким описанием. Следующие страницы продолжают этот список. Внизу страницы находится строка навигации с номерами страниц. Сайты в этом списке располагаются в соответствии с неким рейтингом, который определяет сам поисковик.
Попасть «на первую страницу Яндекса», да еще и по интересному запросу — мечта любого хозяина сайта.
При поиске существуют две крайности: в одном случае поисковик сообщает, что по нашему запросу ничего не найдено, в другом — предлагает многомиллионный список, который не просмотреть и за всю жизнь. Если я в строке запроса попрошу работу недалеко от дома, с хорошей зарплатой и необременительными обязанностями, то поисковик, скорее всего, сообщит, что по моему запросу ничего не найдено. Если же я введу в поле поиска слово работа, то мне будет предложен список из более полумиллиарда страниц. Задача в идеале сводится к тому, чтобы, сужая поиск, получить список из нескольких страниц, на которых наверняка присутствует ответ на наш запрос. Если после запроса работа поставить флажок в Санкт-Петербурге, то из 505 млн страниц останется только 14 миллионов. Конечно, это тоже очень много. Далее можно конкретизировать область деятельности и поискать в найденном.
Читать дальше
Конец ознакомительного отрывка
Купить книгу