150 Tapestry помогала пользователю оценивать электронные сообщения как «пло-
хие» или «хорошие», ориентируясь по оценкам других людей. Например, некто
мог обратить внимание на документы, которые отметил конкретный человек, или мог воспользоваться документами, аннотации которых содержат ключевые
слова. (См.: Terveen L., Hill W. Beyond Recommender Systems…) 151 Тут возникает задача суммирования рецензий, рассмотренная, например, в рабо-
те: Hu M., Liu B. Mining and Summarizing Customer Review // Proc. of the 10th ACM
SIGKDD, 2004. P. 168–177.
152 Поисковик Google сообщал о намерении платить внештатным экспертам за при-
182
ГЛАВА 2.7. ОБЗОР РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ
дателями движут немеркантильные интересы, возможно, потребность в
расширении знаний или в выстраивании обратной связи с пользовате-
лями, или стремление приобрести статус эксперта. Часто все, чего они
ждут – это благодарность за разъяснение, советы или провокационные
реакции.
2.7.3. Коллаборативные методы производства
рекомендаций
Системы коллаборативной фильтрации основываются на двух
принципах и, соответственно, бывают двух типов: анамнестические
(memory-based) и модельные (model-based)153.
Анамнестические алгоритмыпродуцируют оценки клиента, исходя
из его предшествующих оценок154 и совокупности оценок, данных товару
другими пользователями. Это типичная поклиентская, или, иначе, субъ-
ект-субъектная схема коллаборативной фильтрации. Чтобы подсказки
были точны, нужно решить две задачи: отфильтровать качественных ре-
комендателей и резюмировать их оценки. Вкусовое подобие между кли-
ентами устанавливается на основании того, какие оценки они дали одним
и тем же товарам155. А вот вычисляться оно может либо корреляцион-
сланные аналитические материалы о продуктах.
153 Breese J. S., Heckerman D., Kadie C. Empirical Analysis of Predictive Algorithms for Collaborative Filtering //Proc. 14th Conf. Uncertainty in Artifi cial Intelligence, July 1998; Billsus D., Pazzani M. Learning Collaborative Information Filters // Proc. Intl Conf. Machine Learning, 1998.
154 Nakamura A., Abe N. Collaborative Filtering Using Weighted Majority Prediction Algorithms // Proc. 15th Intl Conf. Machine Learning, 1998; Delgado J., Ishii N. Memory-Based Weighted-Majority Prediction for Recommender Systems // Proc. ACM SIGIR’99
Workshop Recommender Systems: Algorithms and Evaluation, 1999; Resnick P., Iakovou N., Sushak M., Bergstrom P., Riedl J. GroupLens: An Open Architecture for Collaborative Filtering of Netnews // Proc. 1994 Computer Supported Cooperative Work Conf., 1994; Shardanand U., Maes P. Social Information Filtering: Algorithms for Automating «Word of Mouth» // Proc. Conf. Human Factors in Computing Systems, 1995.
155 В методе линейного сходства клиент и потенциальный рекомендатель представ-
ляются как два вектора m-мерного пространства, а сходство между ними опреде-
ляется по косинусу угла между двумя соответствующими векторами: где
– скалярное произведение двух векторов.
183
ЧАСТЬ 2. УХУДШАЮЩИЙ ОТБОР В ИНДУСТРИЯХ КУЛЬТУРЫ
ным методом (используется коэффициент корреляции Пирсона), либо
методом линейного сходства. Простейший способ измерения сходства
между пользователями – по среднеквадратичному отклонению.
Для улучшения работы системы используются различные модифи-
кации ранее описанных методов156. В частности, для преодоления де-
фицита оценок конкретного пользователя и подбора ему подходящих
рекомендателей прибегают к «голосованию по умолчанию» (эта схема
подходит в том случае, если все потребляют одно и то же и сходным об-
разом оценивают). Эмпирически установлено, что точность предсказа-
ния растет, если присваивать неоцененным товарам некую гипотети-
ческую оценку. Чтобы получить ее, предложено вычислять сходство не
между пользователями, а между товарами157.
Поскольку вкусы людей из группы рекомендателей, подобранных
компьютерной программой для данного клиента, хотя и близки между
собой, но все же не идентичны, нужно каким-то образом резюмиро-
вать их общую оценку. В примитивном варианте она вычисляется как
простое среднее. В то же время ясно, что чем более сходны во вкусах
клиент и кто-то из его рекомендателей, тем весомей должен быть вклад
оценки данного рекомендателя в предсказание, обобщающее мнение
группы. Однако и в этом варианте учтено не все: в частности, поль-
зователи по-разному воспринимают шкалу оценок. Эта проблема сни-
мается, если абсолютные значения оценок корректируются с учетом
систематического сдвига от среднего для соответствующего рекомен-
дателя (так нивелируется общая позитивная или негативная установка
абонента).
Примем для простоты, что в нашем распоряжении для тестирования вкусов
только три произведения. Тогда каждого рекомендателя можно схематически
Читать дальше