Исследователи из Сколтеха совместно с одним из крупных европейских банков разработали нейронную сеть, которая превосходит самые современные решения в области использования данных о банковских транзакциях для оценки кредитоспособности клиентов.
Результаты исследования опубликованы в трудах Международной конференции IEEE International Conference on Data Mining (ICDM) 2020 года. Алгоритмы машинного обучения уже широко используются в управлении рисками, помогая банкам в оценке клиентов и их финансового положения. «Современный человек и особенно клиент банка постоянно оставляет свои следы в цифровом мире. Например, информация о переводе денег другому лицу всегда остается в платежной системе.
Таким образом, у каждого человека образуется большое количество связей, которые можно представить в виде направленного графа, содержащего дополнительную полезную информацию для оценки клиента. Основная задача нашего исследования – обеспечить эффективную обработку и использование больших объемов разнообразной информации о связях между клиентами», − отмечается в опубликованной статье.
Исследователи Сколтеха Максим Панов, Кирилл Федянин и их коллеги из банковской сферы смогли показать, что использование данных о переводах между клиентами значительно улучшает качество кредитного скоринга по сравнению с алгоритмами, в которых используются только данные о заданном клиенте. Учет таких данных не только позволит банкам готовить более выгодные предложения для своих надежных клиентов, но и снизит негативные последствия мошеннических действий.
«Любой отдельно взятый клиент банка характеризуется в том числе совокупностью его социальных и финансовых связей с другими людьми, поэтому в нашем случае клиенты банка рассматривались как группа взаимосвязанных финансовых агентов. В этом исследовании мы поставили перед собой задачу выяснить, применима ли к финансовым агентам известная пословица «Скажи мне, кто твой друг, и я скажу, кто ты»», − говорит Максим Панов.
Исследователи использовали сверточную графовую нейронную сеть специальной архитектуры для обработки графов, в которых узлы графа соответствуют обезличенным идентификаторам клиентов банка, а ребра – связям между ними. Таким образом обеспечивается агрегирование данных связанных клиентов и прогнозирование кредитного рейтинга для заданного клиента.
Главная особенность предложенного подхода − возможность обработки крупномасштабных временны́х графов, присутствующих в банковских данных, в неизменном виде, то есть без какой-то предварительной обработки, которая зачастую очень трудоемка и приводит к частичным потерям содержащейся в этих данных информации.
Исследователи провели тщательное экспериментальное сравнение шести моделей, в котором победу одержала модель EWS-GCN. «Успех этой модели можно объяснить тремя факторами. Во-первых, модель напрямую обрабатывает полные данные о банковских транзакциях и тем самым сводит к минимуму потери содержащейся в них информации. Во-вторых, структура модели специально построена таким образом, чтобы она одновременно обладала высоким качеством предсказания и была вычислительно эффективной. Наконец, мы предложили специальную процедуру обучения для системы в целом», − отмечает Максим Панов.
Он также подчеркивает, что любая модель, предназначенная для использования в банковской сфере, должна быть очень надежной. «Сложные модели нейронных сетей пока остаются уязвимыми для адверсальных атак, поэтому прежде чем говорить о внедрении таких моделей в производственный процесс, необходимо до конца разобраться в таком феномене, как адверсальные атаки, в приложении к нашей модели и провести дополнительные исследования», − отмечает в заключение Панов.
Для того, чтобы быть в курсе новостей в сфере науки, подписывайтесь на наш Telegram-канал.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: