Обучение системы
Скоринговые системы используют статистические методы работы, а значит, нуждаются в массивах исходных данных о ранее выданных кредитах (выборке) для выявления зависимостей. Например, для выявления степени влияния семейного положения на возврат кредита. Появляется вопрос, где это исходное информационное «сырье» взять. Можно, конечно, собирать характеристики клиентов, выдавать кредиты всем подряд и потом фиксировать случаи невозврата или несвоевременного возврата. Ну а тем, кто не хочет применять столь радикальный способ обучения на собственных ошибках, приходится искать альтернативные пути решения проблемы. На самом деле, таких путей всего два. Можно воспользоваться уже собранной кем-то другим базой данных или использовать методы, требующие для корректного применения меньших по объему массивов опытных данных. Первый способ свойствен в первую очередь при разработке банками собственных решений. Второй используется вендорами «серийных» систем скоринга. Однако ни один из этих вариантов нельзя назвать идеальным.
Очевидно, что данные о клиентах, например, американского банка мало подойдут для адекватной оценки российских заемщиков. Совершенно другие доходы, уровень жизни, менталитет делают невозможным использование такой БД даже с сильной коррекцией результатов. Классический подход к скорингу[Регрессионный анализ остается самым распространенным методом, использующимся в скоринге] предусматривает принятие положительного решения о выдаче кредита в том случае, если выходной показатель превышает некий критический порог. А выходной показатель вычисляется как сумма численных характеристик параметров (возраст, количество иждивенцев, доход, наличие кредитной карты и т. д.), помноженных на соответствующий «вес» (значимость показателя в общей оценке). Да и само слово «scoring» можно перевести как «подсчет очков». Обучение системы сводится к подгонке «весов». Так вот «веса» одного и того же параметра для США и РФ будут существенно различаться. Кроме того, очевидно, что кредитоспособность заемщика зависит не только от его собственных характеристик, но и от общей макроэкономической ситуации в стране — например, от уровня инфляции. Кстати, бескрайние просторы нашей Родины накладывают дополнительные трудности. Настраивать систему многофилиальному банку приходится для каждого региона отдельно, так как в разных уголках России люди отличаются как доходами, так и менталитетом.
В компании «Франклин & Грант», специалисты которой занимаются созданием математических моделей и их программной реализацией для решения финансовых задач, утверждают, что в России вообще не существует кредитных историй достаточной длины для обучения системы. Что уж говорить о новых типах кредитных продуктов, появляющихся в стране. Например, об ипотеке, собирать данные по которой для настройки системы нужно еще лет десять.
В ХКФБ проблему решили довольно оригинально, использовав для обучения своей системы скоринга базу данных о 4,2 млн. заемщиков из стран Центральной Европы. В этом случае «веса» различных исходных параметров получились достаточно схожими с российскими, и после небольшой коррекции под национальную специфику и текущий банк система стала работоспособной.
Если имеются выборки сравнительно небольшого размера, разумно использовать иные методы анализа, такие как метод ближайших соседей или дерево классификаций. В первом случае новому заемщику, исходя из каких-либо его характеристик, система ставит в соответствие определенную точку с соответствующими координатами. В зависимости от того, каких точек по соседству с данной большинство: «плохих» или «хороших» (которым соответствуют люди, отдавшие или не отдавшие кредит), принимается решение о выдаче денег. При использовании деревьев классификаций система обучается следующим образом. На основе имеющихся данных строится дерево. При построении все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам (рис. 1). Критерий разбиения — это различные значения входного фактора.
Скоринг на практике
На сегодняшний день системы скоринга строятся на базе «универсальных» аналитических комплексов (SAS, KXEN), реализуются или в виде отдельных приложений, или как модули многофункциональных банковских комплексов (Invoretail, SOWK). В частности, анализ платежеспособности заемщика применяется в последних версиях системы RS-Loans (компания R-Style Softlab), комплексном решении по автоматизации кредитного бизнеса банков. В такой реализации скоринга есть ощутимое преимущество: ведь оценка уже интегрирована в сам процесс выдачи кредита. RS-Loans, по сути, моделирует от начала до конца бизнес-процесс кредитования в виде прохождения документов по цепочке «заявка — кредитный комитет — кредитный договор» с использованием нескольких функциональных элементов: «Кредитный договор», «Клиент», «Договор обеспечения», «Объект обеспечения», «Банковская карта», «Счет», «Операции», «График погашения», «Филиал» и т. д.
Читать дальше