Журнал «Новый мир» - Новый Мир. № 1, 2002

Здесь есть возможность читать онлайн «Журнал «Новый мир» - Новый Мир. № 1, 2002» весь текст электронной книги совершенно бесплатно (целиком полную версию без сокращений). В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: Современная проза, на русском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Новый Мир. № 1, 2002: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Новый Мир. № 1, 2002»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Ежемесячный литературно-художественный журнал

Новый Мир. № 1, 2002 — читать онлайн бесплатно полную книгу (весь текст) целиком

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Новый Мир. № 1, 2002», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Теперь я подошел к тому, чтобы сформулировать основное утверждение этих заметок: главное отличие литературного произведения в Сети от печатной литературы заключается в том, что его читают не только люди. Его читают и даже по мере сил и интеллекта рецензируют роботы поисковых систем.

Это возможно в силу единства сетевого пространства и стандартного представления информации в нем и приводит к тому, что поисковые системы образуют замыкание Сети и делают его односвязанным.

Поисковый робот — программа, которая непрерывно, двадцать четыре часа в сутки, семь дней в неделю, читает одну за другой выставленные в Сети страницы и строит по ним поисковые индексы. От того, как работает эта программа, от того, как использует построенные индексы поисковый портал, зависит в конечном счете, насколько доступной окажется та или иная страница. Подробности работы любой конкретной поисковой системы, будь то Яndex или Google (www.google.com),практически никогда не афишируются авторами. Но многие принципы индексирования и поиска лежат на поверхности, и о них можно сказать.

Все тексты в Сети проиндексированы в разной степени: одни подробно и тщательно — можно зарегистрировать ресурс в поисковой системе и тем обратить на него ее внимание, другие — проигнорированы поисковыми системами вовсе (в частности, при формировании страницы можно «попросить» робот не индексировать ваш ресурс) и потому недоступны при свободном поиске.

В первую очередь индексируются и наиболее легко находятся при поиске синтаксически выделенные конструкции языка. И здесь нужно иметь в виду, что в Сети текст пишется и представляется не на естественном языке — русском или английском, а на языке разметки документа — htmlили dhtml.И конечно, более понятны поисковой программе именно синтаксические конструкции этих языков. То есть она регистрирует титулы, ключевые слова, заголовки всех уровней, ссылки, начала абзацев и другие элементы формальной структуры и обязательно также имена собственные.

Поставим простой эксперимент. Попытаемся отыскать, используя Яndex, «Анну Каренину» Льва Толстого. Сначала для поиска используем первую фразу романа: «Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему». Количество найденных адресов будет очень велико, и не все они будут указывать на роман. Некоторые — на собрания афоризмов. Я задам более жесткое требование и буду искать в найденном эпиграф к роману: «Мне отмщение, и Аз воздам». В результате отбора поисковая система выдаст одиннадцать адресов, из которых десять действительно будут указывать на текст романа Толстого.

Теперь я изменю условия и буду искать фразу из главы 17-й: «Это такая честная, правдивая натура, и сердце золотое». Результатом (точным, а другие нас не устраивают, фраза заведомо звучит так) будут четыре ссылки, из которых только две укажут толстовский текст — www.klassika.ruи orel.rsl.ru/nettext/russian/tolstoy_lev/annak1.htm, — и оба эти адреса уже вошли в список, который мы получили в предыдущем эксперименте. (Если вы повторите мой эксперимент, результат может быть совсем другим. Сеть меняется каждый день, не говоря о нескольких месяцах. Написано 2.10.2001.)

О чем это говорит? Ведь вторая цитата заведомо присутствует в найденных нами в первом эксперименте текстах. Но она — не проиндексирована. То есть поисковая система (в нашем случае Яndex) не связывает ее с адресами, указывающими на текст «Анны Карениной». Потому, в частности, что вторая цитата взята из середины абзаца и не содержит никаких синтаксических конструкций формального языка и собственных имен. Один и тот же по внешнему виду текст может быть в Сети более или менее активен. Он получает возможность, используя поисковые системы, продвигать себя навстречу читателю, облегчая ему поиск и становясь более актуальным сам. Текст, постоянно читаемый и перечитываемый поисковыми системами, не лежит в Сети — он движется, меняется, и происходит это, можно сказать, без участия реального читателя.

Когда писатель пишет и публикует текст, он хочет донести до читателя свою весть — message, как сегодня принято говорить. Чтобы это произошло, текст должен быть, во-первых, доступен, во-вторых, прочитан. Текст должны найти те, кто его ищет, может быть, даже не подозревая о его существовании.

Автор текста в Сети должен четко представить себе те запросы, которые будут адресованы поисковым системам и на которые именно его текст отвечает максимально полно. То есть если его ресурс попадет в отбор, то релевантность ресурса по оценке поисковой программы — другими словами, наиболее полное соответствие запросу — должна быть высокой. Релевантность можно представить себе как способ сортировки найденных по запросу документов. Чем больше документ соответствует запросу, тем выше в списке ответов он должен находиться, тем выше его значимость. Для достижения этого результата могут учитываться следующие параметры: количество найденных слов, «контрастность» слова (его относительную частоту для данного документа), расстояние между словами, положение слова в документе и в зонах документа. Релевантность документа может определяться количеством указывающих на него ссылок и весом этих ссылок — чем солиднее ссылающийся ресурс, тем больше вес. Но этим показателем оперировать крайне трудно. Если вы получите несколько сот или тысяч адресов, то вряд ли вам придется изучать все из них: первые десять — двадцать, вероятно, содержат требуемую информацию.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
Отзывы о книге «Новый Мир. № 1, 2002»

Обсуждение, отзывы о книге «Новый Мир. № 1, 2002» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x