| Применение моделей машинного обучения для исследования кредитного скоринга |
|
| Автор: Бигаева Л.А., Баймиев В.А. |
| 16.05.2026 10:00 |
|
ПРИМЕНЕНИЕ МОДЕЛЕЙ
МАШИННОГО ОБУЧЕНИЯ ДЛЯ ИССЛЕДОВАНИЯ КРЕДИТНОГО СКОРИНГА Бигаева Л.А.,
к.ф-м.н., доцент, Бирский филиал
УУНиТ, г.Бирск, Россия Аннотация.
В статье рассматривается применение моделей машинного обучения для задачи
кредитного скоринга. Проведён сравнительный анализ классических и современных
алгоритмов, описаны этапы подготовки данных и метрики оценки качества. Особое
внимание уделено требованиям регуляторов к интерпретируемости моделей.
Результаты работы могут быть использованы при разработке автоматизированных
систем оценки кредитных рисков. Ключевые слова:
кредитный скоринг, машинное обучение, бинарная классификация, оценка кредитного
риска, интерпретируемость. Введение Кредитный скоринг
помогает банку оценить, вернёт ли заёмщик деньги. Раньше использовали простые
правила («если зарплата > Х, то кредит можно дать»). Они понятны, но не
всегда точны. Машинное обучение
анализирует тысячи примеров и находит сложные закономерности, повышая точность
прогноза [1]. Цель работы
— сравнить классические и современные методы скоринга, выделить проблемы их
внедрения. Какие модели
используют? Задача скоринга — бинарная
классификация: 0 (вернёт) или 1 (дефолт). 1.
Логистическая регрессия
— простая модель, служит точкой отсчёта (бенчмарком). Если сложная
модель не работает заметно лучше, её внедрение нецелесообразно. 2.
Ансамбли деревьев
(Random Forest, Gradient Boosting) — точнее, находят неочевидные связи между
признаками [2]. 3.
Нейронные сети
— для больших и «неаккуратных» данных (тексты, транзакции) [3]. Данные и паттерны Качество модели зависит
от данных. Важный этап — поиск паттернов (устойчивых шаблонов
поведения): ·
«Резкий рост трат»
перед заявкой → возможное финансовое напряжение; ·
«Нерегулярный доход»
→ выше риск для фрилансеров; ·
«Связи с проблемными клиентами»
→ возможный мошеннический паттерн. Также данные нужно:
очистить от ошибок, преобразовать текст в числа, уравновесить выборку (дефолтов
мало) [1]. Как оценить модель? ·
ROC-AUC / Джини:
насколько хорошо модель разделяет «хороших» и «плохих» клиентов. ·
Precision / Recall:
баланс между ошибочным отказом и выдачей кредита ненадёжному заёмщику. ·
LogLoss:
точность предсказанной вероятности [2]. Почему важно объяснять
решения? Банк обязан объяснить
отказ (требования ЦБ РФ). Поэтому «чёрные ящики» используют с осторожностью. Применяют объяснимый
ИИ (XAI): ·
SHAP
показывает вклад каждого признака: «Отказ из-за высокой долговой нагрузки (−40
баллов)». ·
Мониторинг дрейфа
отслеживает изменения в поведении клиентов (например, во время кризиса) [3]. Заключение Машинное обучение
повышает точность скоринга, но: 1.
Простая модель может быть лучше сложной,
если её легче объяснить. 2.
Качество данных важнее выбора алгоритма. 3.
Прозрачность — обязательное требование в
банках. Будущее скоринга — в
балансе точности и объяснимости. Литература 1.
Ульянова О.Д., Золотова Е.А.
Исследование применения искусственного интеллекта и моделей машинного обучения
в процессе оценки кредитоспособности для повышения точности и эффективности
кредитного скоринга // Актуальные научные исследования: от теории к практике :
сборник материалов XLIX Международной очно-заочной научно-практической
конференции : в 2-х томах. — Москва : Интернаука, 2024. — Т. 2. 2.
Черцова И.В., Панкеева А.Д., Муртазаев
Г.Л., Аджиева А.Ю. Вероятностные модели оценки кредитных рисков // Финансовая
экономика. — 2025. — № 11. — С. 324–327. — ISSN 2072-778X. 3.
Кобзенко П.Б. Применение искусственного
интеллекта для оценки эффективности кредитного рейтинга в коммерческих банках
// Финансовая экономика. — 2025. — № 11. — С. 64–69. — ISSN 2072-778X. |