Вот на что аналитики обращают больше всего внимания:
✓ средняя длина предложения в знаках;
✓ средняя длина диалога в знаках;
✓ соотношение диалогов и предложений в тексте;
✓ использование уникальных слов (как словарных, так и выдуманных автором);
✓ частота использования уникальных слов;
✓ использование одних и тех же уникальных слов в открытых и анонимных публикациях;
✓ активный словарный запас (количество уникальных словарных слов в тексте);
✓ активный несловарный запас (количество уникальных выдуманных слов в тексте);
✓ статистика использования частей речи – процент существительных, глаголов, прилагательных и т. п.;
✓ биграммы частей речи, то есть частота употребления пар "существительное-глагол", "наречие-прилагательное" и т. п.;
✓ позиции частей речи в предложении (по всем частям речи);
✓ биграммы буквенных пар (подсчет по всем алфавитным парам "аа", "аб", "ав" и т. п.).
Для лингвистического анализа текста специалисты используют набор различных методов. С некоторыми из них вы можете познакомиться по адресу: http://filologia.su/metody. В Интернете также можно найти программы для лингвистического анализа текста – например, Лингвистический анализатор 2.0, который можно скачать бесплатно по адресу: http://softok.org/science/naukateh/7776prog.html. Программа не заменит вам опытного аналитика, но все же это лучше, чем ничего.
В общем, информации в Интернете по этой теме – очень много, но наша книга посвящена анонимности в Интернете, а не лингвистике. Главное, чтобы вы знали, что такой способ деанонимизации существует, а предупрежден – значит вооружен.
11.3. Наиболее частые ошибки
Исходя из всего ранее сказанного, выделим основные ошибки, совершаемые желающими быть анонимными пользователями:
✓ использование анонимных и неанонимных сессий для одного и того же вида деятельности – например, при регистрации e-mail и блога вы не анонимизировали трафик, но начали это делать при ведении блога. Понятно, что легко запросить у администратора блога IP-адреса, которые были зафиксированы при регистрации блога, чтобы понять, кто вы;
✓ элементарная забывчивость – забыли включить Tor, забыли перенастроить браузер (например, сначала отменили установку прокси-сервера Tor, чтобы скачать фильм, а затем забыли и продолжили работу, но уже не в анонимном режиме). Чтобы хоть как-то помочь себе, установите два браузера: один вы будете использовать в анонимном режиме, второй – для обычного серфинга;
✓ публикация больших текстов сходного стиля написания под своим обычным именем. Или ничего не публикуйте под своим именем, или же измените стиль написания перед публикацией анонимного контента;
✓ доступ к анонимному почтовому ящику без шифрования – всегда используйте шифрование трафика для доступа к своему анонимному почтовому ящику;
✓ отказ от анонимизации трафика при работе с чужого компьютера – самая распространенная ошибка. Некоторые пользователи почему-то думают, что если они используют чужой компьютер (например, компьютер друга, родственника, соседа и т. п.), то уже анонимны. Это не так, и анонимизация трафика обязательна и в этом случае. Иначе вас очень легко будет выследить – придут к тому, у кого вы были, и спросят, он ли заходил на тот или иной ресурс. Он ответит, что не он и что вы были у него в гостях в то время.
В главе 12 вы узнаете, какие программы нужно использовать, чтобы остаться анонимным. Ведь иногда все старания идут насмарку, если программы для работы с Интернетом сами сообщают куда нужно всю информацию о вас…
Глава 12. Программы с "сюрпризом"
12.1. Программы с открытым кодом
Для обеспечения большей анонимности вы должны использовать программы с открытым исходным кодом (так называемые OpenSource-программы). Исходный код таких программ свободно доступен на сайтах разработчиков программ.
Возникает вопрос: почему именно OpenSource? У таких программ есть одно большое преимущество – их исходный код открыт, а это означает, что в коде программы нет "черных ходов" (backdoors), и эти программы не передают информацию о передаваемых с их помощью данных своим разработчикам или кому-то еще. Ведь если бы это было так, общественность очень быстро бы об этом узнала. В мире много энтузиастов, исследующих исходный код программ на наличие всевозможных ошибок. Если в исходном коде того же Firefox будет найдена "черная дверь", через пару минут об этом узнает весь мир.
Читать дальше
Конец ознакомительного отрывка
Купить книгу