Методика оценки заемщиков, приводящая к увеличению дохода и уменьшению невозврата
Д. Шерстобитов,
директор по управлению
рисками ООО "Скориста"
О. Телицина,
ведущий аналитик
ООО "Скориста"
Журнал "Микроfinance+", N 2, апрель-июнь 2016 г., с. 86-92.
Группа специалистов компании "Скориста" на протяжении нескольких лет занимается изучением заемщиков микрофинансовых организаций (далее - МФО). Как показала практика, для снижения рисков рекомендуется делить заемщиков по ряду признаков в зависимости от анкетных данных, количества обращений в МФО, способу погашения займов, сумме и сроку займа и др.
1. Сегментация потока
Первоначально необходимо разделить клиентов в зависимости от количества закрытых займов в МФО, то есть заемщик обращается в МФО в первый раз или повторно. Это позволит избежать оттока повторных клиентов, которые обычно гасят займы значительно лучше первичных, и, значит, подходы к их оценке должны быть более лояльными, а также отслеживать показатели в рамках каждого типа клиентов и своевременно вносить поправки в нужный сегмент.
Заемщиков, которые берут заем первично, необходимо разделить в соответствии с наличием или отсутствием кредитной истории. Это важно для подбора источников данных и искомой переменной.
Далее стоит обратить внимание на наличие или отсутствие просрочки по погашению займов. Если всех клиентов, которые погасили заем, считать хорошими вне зависимости от уровня просрочки платежей, то в дальнейшем это способствует колебаниям показателей по возвратности и мешает управлению ими. То есть стоит разделить клиентов на тех, кто досрочно оплатил заем, и на тех, кто вышел на просрочку свыше 15 дней.
Следующий тип сегментации - по способу погашения займа. Сумма может быть погашена полностью или частично, соответственно, в зависимости от доли тех или других заемщиков определяется искомая переменная, ориентированная на поиск мошенников, которые ничего не гасят, либо усиливается модель искомой переменной, которая очищает от заемщиков, частично погасивших заем.
Также стоит разделять заемщиков в зависимости от суммы и срока займа и применять для них разные подходы.
Тем самым, разделив поток заемщиков на группы, каждую группу рекомендуется рассматривать как отдельную часть продуктовой линейки со своими подходами к поиску искомой переменной.
2. Подготовка выборки
Выборка заемщиков представляет собой массовый поток, который можно разделить в соответствии с сегментацией клиентов, описанной выше.
Каждого заемщика необходимо промаркировать в зависимости от погашенной суммы: ничего не погасил, погасил более 0 и менее суммы займа, погасил сумму займа и более. Оценить долю каждого клиента в выборке, после чего определить целевую искомую переменную (рис. 1).
Если доля "ничего не погасили" больше доли "погасили сумму займа и более", то искомая переменная основной модели должна быть нацелена на поиск мошенников, которые берут заем и ничего не платят. При этом из обучающей выборки необходимо исключать тех, кто гасит заем частично.
Если доля "погасили больше 0 и меньше суммы займа" больше 30%, необходима дополнительная искомая переменная и вспомогательная модель, которая позволит очистить поток от таких клиентов. В данном случае из обучающей выборки необходимо исключить "ничего не погасили", так как их отсев производится основной моделью.
При сегментации необходимо обращать внимание на уровень просрочки (рис. 2) и при поиске искомой переменной ориентироваться на доходность.
Тех, кто погасили досрочно или вышли на допустимый уровень просрочки, считать хорошими, остальных маркировать как плохих. Допустимый уровень просрочки для каждой МФО определяется исходя из ее стратегии. Рекомендуется устанавливать допустимый уровень просрочки 15 дней.
3. Разработка параметров и методы предсказания искомой переменной
Ключевым моментом для построения качественной скоринговой модели является внимательная работа сданными, которые поступают из анкеты потенциального заемщика, бюро кредитных историй, а также иных информационных источников. Данная информация необходима для описания искомой переменной, которая будет предсказывать событие N (например, выход на просрочку заемщика в зависимости от допустимого срока просрочки или доходность с выданного займа). При обработке таких данных выявляются связи, характеризующие целевую переменную, то есть разрабатываются переменные, на основе которых строится модель. В качестве примера можно назвать такие переменные, как возраст кредитной истории заемщика, доля просроченных кредитов, пол, количество уникальных номеров телефонов в кредитной истории и т.д.
Поиск хороших переменных достаточно трудоемкий процесс, так как хорошие факторы не всегда лежат на поверхности, приходится проводить их агрегацию, создавая сложные многосоставные факторы. Чем обширнее библиотека переменных, тем больше шансов выявить сильный не коррелируемый набор факторов, часть из которых впоследствии включается в модель. Так, например, в библиотеку "Скористы" входит более 7000 переменных. К тому же, при построении модели переменные, хорошо описывающие целевую функцию на одном типе заемщиков (сегментация потока), не всегда будут давать такой же предсказательный результат на другом типе. Поэтому, обладая двумя сотнями переменных, вряд ли можно выявить хороший набор переменных и добиться качественного результата при построении разных моделей для разных типов заемщиков.
При работе с переменной обращается внимание на количество ее групп, которые будут характеризовать заемщика и присваивать ему балл. С одной стороны, чем больше групп, тем более точное описание дается целевой переменной, однако далеко не всегда большое количество групп у переменной является лучшим вариантом. Необходимо, в первую очередь, следить за ежемесячной стабильностью групп переменной, а также сравнивать качество группировки. К примеру, переменная "доля суммы запросов по кредитным картам", разбитая на 3 группы, имеет информационное значение IV = 0,212865, а на 4 группы IV = 0,213043, разница незначительная, и поэтому правильнее будет выбрать разбиение на 3 группы для лучшей стабилизации переменной.
В "Скористе" система обработки всех 7000 переменных и выявления лучших разбиений на группы автоматизирована, что облегчает работу аналитиков и сокращает трудозатраты.
Рекомендуется оптимизировать искомую переменную, включая в нее желаемые показатели по доходности, просрочке и невозврату.
Для определения оптимального показателя доходности вводится поправочный коэффициент, который рассчитывается, например, исходя из привлеченных средств инвестора или минимальной % ставки кредита в банке, или доли затрат на одного клиента, чтобы миновать точку безубыточности. Средний рассчитанный коэффициент, который рекомендуется использовать, составляет 1,36.
При недостаточности данных для поиска искомой переменной рекомендуется воспользоваться деревом решения. Включая в анализ набор независимых переменных и целевую переменную, можно наглядно увидеть разбиение всех наблюдений в зависимости от значений выбранных факторов. Дерево представляет собой множество наблюдений (корневой узел), разбитое на группы (ветви) по определенным правилам (в данном случае интервалы значений параметров). В каждой группе рассчитывается процент каждого сегмента искомой переменной (если целевая переменная определяется: 0 - заемщик с просрочкой не более 15 дней со дня наступления финального платежа ("хороший") и 1 - заемщик с просрочкой более 15 дней ("плохой"), тогда будет рассчитан процент "хороших" и "плохих" в данной ветви дерева). Это также можно назвать последовательным принятием решения. Логика такова (пример): если параметр-1 принимает значения не более "х", тогда, если параметр-2 больше "а" и меньше "b", тогда если параметр-3 не меньше "с", то принимается решение отказать заемщику (например, в данном сегменте 70% плохих заемщиков). Дерево решений необходимо ежемесячно отслеживать и пересматривать при необходимости.
Если данных достаточно, то для построения модели используется регрессия, это более точный метод скоринга. "Скориста" рекомендует построение модели на основе логистической регрессии как общепризнанный лучший метод разработки скоринговых карт. Данная модель решает задачу классификации, то есть отнесения объекта к классу 1 или 0 (искомая бинарная переменная) на основе предсказанной вероятности. Качество таких моделей определяется ROC-кривой (это графическое представление результатов классификации), она показывает зависимость положительных наблюдений, которые были верно классифицированы от неверно классифицированных отрицательных наблюдений. Чем больше площадь под кривой, тем качественнее построенная модель. Данную характеристику можно преобразовать в систему от 0 до 1 и получить так называемый "коэффициент Джинни", величина которого будет оценивать модель. Допустимого качества считаются модели для скоринга с коэффициентом Джинни более 0,4.
4. Типы моделей
Нельзя создать единую модель, характеризующую абсолютно всех заемщиков, она просто не будет работать (недостаточность данных для одних, разный поведенческий характер для других). Как было сказано выше, необходимо сегментировать всех клиентов. Предлагается, в первую очередь, делить заемщиков на первичных и повторных, то есть обращение в МФО впервые или уже брался хотя бы один заем в данном МФО и успешно закрыт. По "повторщикам" уже есть информация по прошлой платежной дисциплине в этом МФО, поэтому набор переменных будет иным. Как правило, этот сегмент отличается низким уровнем невозвратности.
Данные типы заемщиков делятся еще на несколько сегментов и для каждого строится своя модель. Первичных можно разделить на заемщиков без кредитной истории и с кредитной историей. Эти два сегмента оцениваются с помощью четырех моделей.
Модель TR (Trust rating) - оценка на основе анкетных данных. Джинни 0,44632 (рис. 3).
Модель BRS - оценка на основе данных платежных терминалов. Джинни 0,48636 (рис. 4).
Модель КИ - оценка на основе данных кредитных историй. Джинни 0,56638 (рис. 5).
Модель "Динамо" оценка на основе данных по возвратности займов, которые только частично гасят заем и пропадают. Джинни 0,45832 (рис. 6).
"Скориста" добивается того, чтобы "на бою" все основные модели имели коэффициент Джинни не менее 0,5. По каждой модели выставляются индивидуальные пороги, которые поддерживают необходимый уровень одобрения и невозврата.
Комбинировать модели можно 3 способами: каскадный метод, метод вложения, метод пересечений.
Используя каскадный способ комбинирования всех 4 моделей для скоринга первичных заемщиков, результат Джинни получается 0,61197 за последний квартал 2015 года (рис. 7).
5. Распределение данных
По каждой модели рассчитывается балл и присваивается клиенту. Клиенты должны распределиться от минимального до максимального балла таким образом, чтобы с увеличением баллов невозврат займов уменьшался, а доходность увеличивалась.
На боевых заявках коэффициент Джинни по основным моделям должен сохраняться в пределах 0,45-0,5.
Табл. 1. Пример распределения невозврата по баллу Динамо и баллу КИ
Из данного распределения (табл. 1) видно, что с увеличением балла Динамо и балла КИ невозврат уменьшается (в ячейках показан % невозврата для данного сегмента клиентов по баллам).
Балл | КИ | КИ | КИ | КИ | КИ | КИ | КИ | КИ | КИ | КИ | КИ | |
Динамо | 1600 | -500 | 0 | 100 | 200 | 300 | 400 | 500 | 600 | 700 | 800 | 900 |
Динамо | 800 | |||||||||||
Динамо | 700 | 0% | 0% | 0% | 0% | |||||||
Динамо | 600 | 100% | 0% | 21% | 17% | 10% | 0% | 0% | 0% | |||
Динамо | 500 | 75% | 60% | 39% | 30% | 17% | 13% | 8% | 5% | 0% | ||
Динамо | 400 | 100% | 65% | 56% | 39% | 34% | 21% | 16% | 9% | 5% | 0% | |
Динамо | 300 | 87% | 67% | 66% | 49% | 37% | 32% | 21% | 21% | 0% | ||
Динамо | 200 | 84% | 77% | 80% | 53% | 50% | 40% | 33% | 0% | |||
Динамо | 100 | 80% | 100% | 71% | 67% | 67% | 100% | |||||
Динамо | 0 |
6. Определение порогового значения
Для определения порогового значения строится калибровочная матрица. Период пересчета составляет 3-6 месяцев, предшествующих последнему закрытому месяцу.
Каждого клиента необходимо промаркировать: хороший/плохой/неизвестный, в зависимости от дней просрочки и погашенной суммы.
Хороший - погасили всю сумму займа и не вышли на просрочку.
Плохой - ничего не погасили или погасили тогда, когда вышли на просрочку.
Неизвестный - ничего не погасили или частично погасили, но просрочка еще не наступила.
Для принятия решения по порогу используются 4 измерения: 0+, 15+, 45+, 90+, обозначающие количество дней просрочки.
0+ клиенты, которые вышли на просрочку.
15+ клиенты, которые вышли на просрочку более 15 дней.
45+ клиенты, которые вышли на просрочку более 45 дней.
90+ клиенты, которые вышли на просрочку более 90 дней.
В зависимости от бизнес-стратегии МФО решение принимается по тем показателям, которые являются целевыми для нее. Решение принимается в рамках просрочки по показателю невозврата и показателю дохода. Матрица строится для каждого балла с шагом 100 баллов от -100 до 1000. При необходимости шаг можно уменьшить до 50 или 25.
7. Матрица принятия решения
Строятся матрицы 2-х типов: "с хвостом", когда значения рассчитываются для всей выборки больше обозначенного балла, и "без хвоста" (табл. 2, 3), когда значения рассчитываются для выборки от обозначенного балла до следующего, с шагом 100 баллов.
Нижеприведенные матрицы построены для клиента за последние 3 месяца, показатели по просрочке 90+ недостаточно достоверны, так как выборка по ним не репрезентативна.
Искомым является показатель по просрочке не более 15 дней, то есть определить и выдать займы тем клиентам, которые погасят кредит и не выйдут на просрочку более 15 дней. Что будет после 15 дней, уже не интересует.
Из матрицы (табл. 2) видно, доход появляется для выборки клиентов с баллом более 300. При этом для данного балла невозврат составляет 21%, что является предельно допустимым для просрочки 15 и более дней, % одобрения 21, доход составит 87%.
Табл. 2. Калибровочная матрица "без хвоста"
Показатели | от | от | от | от | от | от | от | от | от | от | |
балл КИ | -500 | 0 | 100 | 200 | 300 | 400 | 500 | 600 | 700 | 800 | |
Доля клиентов | 31% | 21% | 18% | 6% | 2% | 0% | 0% | ||||
просрочка | npl 0+ | 67% | 52% | 42% | 33% | 23% | 14% | 20% | |||
просрочка | npl 15+ | 59% | 35% | 25% | 18% | 7% | 1% | 20% | |||
просрочка | npl 45+ | 22% | 18% | 13% | 9% | 3% | 0% | 0% | |||
просрочка | npl 90+ | 0% | 1% | 2% | 1% | 0% | 0% | 0% | |||
доход, % | npl 0+ | -41% | -1% | 34% | 47% | 61% | 77% | 4% | |||
доход, % | npl 15+ | -26% | 44% | 90% | 94% | 110% | 113% | 4% | |||
доход, % | npl 45+ | -26% | 63% | 109% | 111% | 128% | 113% | 9% | |||
доход, % | npl 90+ | -17% | 73% | 118% | 124% | 128% | 113% | 9% |
Помимо баллов отказать можно по набору стоп-факторов, этот набор для разных типов клиентов может быть разным. Работа по подбору стоп-факторов проводится в процессе выбора предсказательных переменных и имеет свои нюансы.
Табл. 3. Калибровочная матрица "с хвостом"
Показатели | от | от | от | от | от | от | от | от | от | от | |
балл КИ | -500 | 0 | 100 | 200 | 300 | 400 | 500 | 600 | 700 | 800 | |
Доля клиентов | 31% | 21% | 18% | 6% | 2% | 0% | 0% | ||||
просрочка | npl 0+ | 37% | 37% | 34% | 29% | 21% | 14% | 20% | |||
просрочка | npl 15+ | 21% | 21% | 18% | 14% | 6% | 2% | 20% | |||
просрочка | npl 45+ | 10% | 10% | 9% | 6% | 2% | 0% | 0% | |||
просрочка | npl 90+ | 1% | 1% | 1% | 1% | 0% | 0% | 0% | |||
доход, % | npl 0+ | 37% | 38% | 46% | 53% | 64% | 73% | 4% | |||
доход, % | npl 15+ | 86% | 87% | 96% | 99% | 109% | 106% | 4% | |||
доход, % | npl 45+ | 103% | 104% | 113% | 116% | 123% | 106% | 9% | |||
доход, % | npl 90+ | 112% | 113% | 122% | 124% | 123% | 106% | 9% |
8. Подведение итогов
Рассмотренная методика оценки заемщиков реализована и используется в действующем онлайн-сервисе по оценке заемщика Scorista.ru ("Скориста"). За годы работы с действующими МФО методика проверена на практике и доказала свою эффективность. Показатели работы системы настраиваются для каждого клиента-МФО индивидуально, исходя из его пожеланий и специфики бизнеса. Выдача займов осуществляется в нужные сегменты заемщиков, приносящих МФО наибольший доход. Таким образом, МФО получают запланированный доход при контролируемых рисках. Дальнейшее развитие и непрерывное совершенствование методики оценки заемщика специалистами компании с учетом изменений актуальной экономической ситуации и "портрета" заемщика дает МФО возможность уверенно развивать свой бизнес.
Если вы являетесь пользователем интернет-версии системы ГАРАНТ, вы можете открыть этот документ прямо сейчас или запросить по Горячей линии в системе.
Журнал "Микроfinance+"
("Микрофинанс+")
Учредители: Национальное Партнёрство Участников Микрофинансового Рынка (НАУМИР) и ЗАО "Центр Платёжных Инноваций" (ЦПИ).
Свидетельство о регистрации средства массовой информации ПИ N ФС77 - 43242 от 24.12.2010 года.
Периодичность выхода в свет: ежеквартально.
Редакционный совет журнала
Арифов Александр Александрович (председатель Редакционного совета журнала) - председатель Правления, член Совета директоров ЗАО Банк "ЦЕРИХ", председатель Совета СРО НП "МиР"
Багинский Игорь Николаевич - председатель Союза сельских кредитных кооперативов
Волохонский Юрий Николаевич - председатель Совета ЮРАКС (Южнорегиональной ассоциации кредитных союзов)
Достов Виктор Леонидович - председатель Совета некоммерческого партнерства "Содействие развитию рынка электронных денег"
Исаева Татьяна Васильевна - главный редактор журнала "Микроfinance+"
Кадров Анатолий Михайлович - член Совета НП "Кооперативные финансы", исполнительный директор ЮРАКС (Южнорегиональной ассоциации кредитных союзов)
Пухов Антон Владимирович - директор по развитию Центра Исследований Платёжных Систем и Расчётов
Стратьева Елена Сергеевна - вице-президент НАУМИР, директор Российского Микрофинансового Центра
Тагирова Виктория Таликовна - вице-президент НАУМИР