Название реферата: Анализ эффективности кредитных организаций
Раздел: Банковское дело
Скачано с сайта: www.newreferat.com
Дата размещения: 18.08.2011

Анализ эффективности кредитных организаций

Содержание

Содержание. 2

Введение. 3

Глава 1. Обзор свойств моделей оценки кредитного риска. 5

1.1. Понятие качества и прозрачности методик. 5

1.2. Характеристики физического лица. Структура данных. 8

Глава 2. Статистические и эконометрические методы оценки риска. 9

2.1. Скоринговые методики. 9

2.2. Кластерный анализ. 11

2.3. Дискриминантный анализ. 13

2.4. Дерево классификаций. 15

2.5. Нейронные сети. 16

2.6. Технологии Data mining. 17

2.7. Линейная вероятностная регрессионная модель. 17

2.8. Логистическая регрессия. 19

Заключение. 22

Литература. 24

Введение

По мере роста объемов кредитования растут риски, принимаемые на себя банковской системой. Для повышения эффективности банковского надзора и де­ятельности самих банков назрела необходимость в более точной оценке этих рис­ков. Во всем мире весьма актуальна задача построения стабильной и эффективной банковской системы, которую можно решить путем повышения уровня капитали­зации и внутреннего контроля банков. В международной практике для оценки достаточности капитала банковской системы используются нормативы, разраба­тываемые Базельским комитетом по банковскому надзору, получившие название соглашений по капиталу. Эти соглашения, с одной стороны, дают ориентиры на­циональным надзорным органам по контролю за банковской системой страны, а с другой – представляют собой международные “правила игры” отказ от которых снижает доверие к банкам.

Группа центральных банков 10 стран, являющихся членами Базельского коми­тета по банковскому надзору, после пяти лет обсуждений официально одобрила новое Базельское соглашение (Базель II). Новые правила, вступившие в силу в конце 2006 года, предусматривают более справедливую оценку банковских рисков и пересмотр стандартов достаточности банковского капитала и резервов для на­дежных и крупных банков. Новое Соглашение призвано содействовать развитию системы регулирования капитала банков и повышению чувствительности мини­мально допустимого размера капитала к оценке рисков. Глобальное регулирование капитала банков необходимо для надежной и здоровой международной банковской системы стран-участниц, применяющих данные соглашения.

Соглашение внедряется в странах-членах Банка международных расчетов, начиная с конца 2006 года и ориентировочно до 2008-2009 годов. Оно состоит из трех компонентов:

1. требования к минимальному размеру капитала с учетом реального риска экономических потерь каждого банка;

2. надзор за достаточностью капитала. Необходимость осуществления эффек­тивного надзорного процесса за внутренними системами оценки рисков, при­нимаемых банками. Этот процесс направлен на подтверждение того факта, что руководством банка выносятся адекватные суждения об уровне рисков и, соответственно, величина капитала, создаваемого банками для их покрытия, достаточна;

3. публичное раскрытие информации - перечень информации, подлежащей пуб­личному раскрытию, что позволяет более точно оценить адекватность капи­тализации банка.

Соглашение “Базель II” направлено на увязывание требований к капиталу с кредитоспособностью заемщиков. Оно предлагает три подхода к оценке кредит­ного риска.

Подходы к оценке кредитного риска

Стандартный подход разработан для банков, осуществляющих менее слож­ные формы ссудных операций и кредитного андерайтинга, а также имеющих более простые структуры внутреннего контроля. Такие банки могут использовать внеш­ние источники оценки кредитного риска для определения кредитного качества заемщиков в целях поддержания капитала на уровне, требуемом надзорными ор­ганами. Например, использовать рейтинги, присвоенные такими агентствами, как Moody’s Investors Services u Standard & Poor’s.

Базовый подход на основе внутренних рейтингов. Банки сами производят расчет вероятности дефолта для своих заемщиков, а затем используют цифры, предоставляемые органами банковского надзора по убыткам в случае дефолта, риску потенциальных убытков в случае дефолта и сроку погашения для расчета требований по капиталу.

Усовершенствованный подход на основе внутренних рейтингов. Банки ис­пользуют свои собственные оценки по всем четырем переменным. Банкам необхо­димо собрать данные за несколько прошедших лет о состоянии своих заемщиков и показать надзорным органам надежность и стабильность своих рейтинговых оценок. Это требует крупных инвестиций по времени и финансам. Только относи­тельно небольшое число крупных банков будет использовать усовершенствован­ный подход на основе внутреннего рейтинга.

Базель II нацеливает банки на совершенствование и использование более слож­ных и точных систем оценки рисков, а также на осуществление более эффектив­ных процессов контроля за принимаемыми рисками. Эти побудительные мотивы реализуются в форме пониженных требований к капиталу.

В целом новый механизм оценки рисков призван уменьшить сроки организации процесса кредитования, привести к снижению издержек и значительному удешев­лению кредитов и инвестиций, более эффективно использовать ценные бумаги для привлечения ликвидности с внешних рынков капитала. В то же время он не лишен недостатков.

Недостатки методик Базеля II

1. Стремясь одновременно решить две задачи - стимулировать банки к соб­ственной оценке рисков и не дать им возможность существенно манипули­ровать этой оценкой, Базельский комитет ввел, по оценкам международных экспертов, чересчур сложные формулы оценки риска. Чтобы минимизиро­вать отвлечение средств на возможные потери по ссудам, банки будут ста­раться занизить оценки риска. В такой ситуации явное преимущество по­лучают крупные банки, которые смогут получить доступ к использованию продвинутого подхода, оставляющего больше пространства для манипулиро­вания. Соответственно мелкие и средние банки оказываются в менее выиг­рышном положении.

2. Стандартный подход использует рейтинги агентств, которые на практике рейтинговые агентства, учитывая недостаточность информации, предпочи­тают основываться в своих расчетах на прошлых данных. А это означает, что рейтинговые оценки не будут обладать в полной мере теми функциями, которые от них требуют базельские стандарты. Основываясь на этих оцен­ках, банки будут предоставлять избыточный объем кредитов в стадии роста экономики, не задумываясь об их возвращении в будущем, и урезать предо­ставление кредитов в стадии спада, тем самым затрудняя выход из него.

Выходом из ситуации, по мнению органов банковского надзора, может стать использование внутренних банковских методик расчета рисков. Они в меньшей степени подвержены колебаниям, чем рейтинги, присваиваемые агентствами. Ста­тистические модели для прогноза рисков дают противоречивые и необъективные прогнозы, недооценивая риск совместного падения различных активов. Выбрана не лучшая мера риска, в то время как лучшие модели риска существуют. Надеж­да на рейтинговые агентства при стандартном подходе к оценке кредитного риска ошибочна, поскольку агентства демонстрируют противоречивые оценки кредито­способности одного и того же клиента. Они неконтролируемы, и качество оценок риска ненаблюдаемо.

Актуальна задача разработки качественно новых методик оценки рисков. Это­му и посвящена работа.

Цели работы:

1. описать существующие статистические и эконометрические методики оценки банковских рисков;

2. показать недостатки методик, выявить лучшие.

Глава 1. Обзор свойств моделей оценки кредитного риска

1.1. Понятие качества и прозрачности методик

Проблема количественной оценки и анализа кредитных рисков и рейтингов заемщиков и создания резервов на случай дефолта является актуальной как для западных, так и российских банков, занимающихся кредитованием физических и юридических лиц. В общем случае кредитный риск при предоставлении кредитов ком­мерческими банками физическим и юридическим лицам характеризу­ется следующими количественными параметрами: риск как вероятность неуспеха (невозврата) кредита; допустимый риск; средний риск; возможные потери от дефолта кредита; среднее значение потерь; максимально допустимые потери; число кредитов в банке; возможное число разных кредитов; число опасных кредитов; энтропия опасных кредитов [5].

Под кредитным риском понимают риск возникновения у кредитной организации убытков вследствие неисполнения, несвоевременного либо неполного исполнения должником финансовых обязательств перед кре­дитной организацией в соответствии с условиями договора. В балансе банка кредитный риск присутствует в составе активов по большинству позиций: ссуды, остатки на корреспондентских счетах, краткосрочные кредиты коммерческим банкам, ценные бумаги, приобретенные для пе­репродажи или инвестирования. Кредитный риск также возникает в связи с широким спектром банковской деятельности, включая выбор инвестиционных портфелей, контрагентов по сделкам с производными инструментами и иностранной валютой. Кредитный риск может появ­ляться в связи с риском проведения операций в данной стране, а также при выполнении функций гаранта. Кредитный риск оказывает прямое воздействие на состояние банковского капитала. В результате высокий кредитный риск снижает рыночную стоимость акций банка и сужает возможности кредитной организации воспользоваться облигационными займами с целью привлечения средств.

К методикам для количественной оценки кредитных рисков предъ­является особое требование по прозрачности, включающей количе­ственные оценки точности и робастности.

Прозрачность методики кредитного риска - это возможность видеть не только явление в целом, но и его детали. Прозрачность стала важ­нейшей характеристикой методик оценки кредитных рисков в силу необходимости наиболее полной идентификации как кредитного риска, так и самой модели кредитного риска. Под прозрачностью методики бу­дем понимать строгость используемых математических методов, сгла­живание субъективности экспертных оценок, наглядность результатов оценки и анализа риска, полное их понимание самими работниками банков, открытость методик для контролирующих органов и заемщи­ков. Прозрачность методики и результатов достигается вычислением вкладов инициирующих событий (критериев) в кредитный риск.

Для анализа, прогнозирования и управления кредитным риском каждому банку необходимо уметь количественно определять назван­ные характеристики, анализировать риск и выполнять постоянный мо­ниторинг компонент характеристик кредитного риска.

От точности распознавания зависит решение о выдаче или отказе в кредите, цена (процент) за риск и уровень резервирования на слу­чай дефолта кредита. Точность оценивается количеством относитель­ных ошибок в распознавании «плохих» и «хороших» кредитов (клиен­тов) и их средним количеством. Обычно выдвигается требование, что­бы «плохие» кредиты распознавались лучше. Отношение неправильно распознанных «хороших» и «плохих» кредитов выбирают от 2 до 10. Аналогично формулируется задача точности, если кредиты классифи­цируются не на два, а несколько классов. Сравнение разных методик на одних и тех же данных показало, что разные методики оценки риска отличаются по точности почти в два раза.

Робастность характеризует стабильность методик оценки кредит­ных рисков. Разные методики риска или одна методика при разных алгоритмах обучения по статистическим данным неодинаково класси­фицируют кредиты на «хорошие» и «плохие». Один и тот же кредит по одной методике может быть признан «плохим», а по другой методи­ке «хорошим». Такая нестабильность в классификации достигает 20% от общего числа кредитов. Сравнение разных методик на одних и тех же данных показало, что разные методики риска могут отличаться по робастности в семь раз.

Кредитование юридических и физических лиц является одним из ос­новных видов деятельности коммерческих и государственных крупных, средних и мелких банков. Каждый банк индивидуален, так как работа­ет по различным технологиям, обслуживает различные сегменты рынка банковских услуг, ориентируется на различные стратегические задачи. Индивидуальности банков способствует также конкуренция.

Кредитный бизнес связан с риском. Условия кредитной деятельно­сти изменяются, изменяется также допустимый уровень риска. Кредит­ная деятельность адаптируется к условиям развивающейся экономики страны и уровню жизни ее населения.

Большое значение для обеспечения устойчивого функционирования банка имеют методы количественной оценки и анализа кредитного рис­ка. Цена за риск должна максимально точно учитывать величину риска каждого кредита. Кроме средней величины риска, определяемой по ста­тистике предыдущей деятельности, банк должен знать количественную оценку и составляющие риска для каждого кредита.

Каждый банк разрабатывает свою модель риска для количественной оценки и анализа риска кредитов с учетом общих рекомендаций Базельского комитета по банковскому надзору. Чем выше точность оцен­ки риска кредитов, тем меньше потери банка, меньше процент за кре­дит и выше конкурентоспособность банка. От повышения точности и прозрачности методик выигрывает все общество в целом. Создание эф­фективной модели риска и оптимальное управление кредитным риском возможны только на основе постоянного количественного анализа статистической информации об успехах кредитов.

Существуют различные подходы к определению кредитного риска частного заемщика, начиная с субъективных оценок специалистов банка и заканчивая автоматизированными системами оценки риска. Ми­ровой опыт показывает, что основанные на математических моделях системы являются более действенными и надежными. В целях построения модели кредитного риска сначала производится выборка клиентов кредитной организации, о которых уже известно, хорошими заемщиками они себя зарекомендовали или нет. Такая вы­борка может варьироваться от нескольких тысяч до сотен тысяч, что не является проблемой на Западе, где кредитный портфель компаний может состоять из десятков миллионов клиентов. Выборка содержит информацию по двум группам кредитов, имевшим место в деятельно­сти банка: «хорошим» и «плохим» (проблемным или невозвращенным).

Ниже выполнен анализ прозрачности скоринговых методик оценки кредитных рисков

1.2. Характеристики физического лица. Структура данных

Кредиты физических лиц описываются 20 признаками, каждый их которых имеет градации (Таблица 1.)

Таблица1. Описание кредита физического лица

Номер признака

Наименование признака

Обозначение

Число градаций

0

Успешность кредита

Y

2

1

Сумма счета в банке

Z1

4

2

Срок займа

Z2

10

3

Кредитная история

Z3

5

4

Назначение займа

Z4

11

5

Сумма займа

Z5

10

6

Счета по ценным бумагам

Z6

5

7

Продолжительность работы

Z7

5

8

Взнос в частичное погашение

Z8

4

9

Семейное положение и пол

Z9

4

10

Совместные обязательства или поручитель

Z10

3

11

Время проживания в данной местности

Z11

4

12

Вид гарантии

Z12

4

13

Возраст

Z13

5

14

Наличие других займов

Z14

3

15

Наличие жилой площади

Z15

3

16

Количество займов с банком

Z16

4

17

Профессия

Z17

4

18

Число родственников на иждивении

Z18

2

19

Наличие телефона

Z19

2

20

Иностранный или местный житель

Z20

2

Таблица данных имеет вид

Таблица2. Структура статистических данных

В работе используются реальные данные. Всего 1000 наблюдений. 700 заемщиков не вернули кредит «1», 300 – вернули «0».

Глава 2. Статистические и эконометрические методы оценки риска

В банках используются, главным образом, следующие методики:

Приступим к описанию этих методик.

2.1. Скоринговые методики

Скоринг кредитов физических лиц представляет собой методику оценки качества заемщика, основанную на различных характеристиках клиентов, таких как доход, возраст, семейное положение, профессия и др. В результате анализа переменных получают интегрированный показатель, который оценивает степень кредитоспособности заемщика по ранговой шкале: «хороший» или «плохой». Дается ответ на вопрос, вернет заемщик кредит или нет? Качество заемщика оценивается опре­деленными баллами, отражающими степень его кредитоспособности. В зависимости от балльной оценки принимается решение о выдаче кре­дита и его лимитах [4].

Привлечение банками для оценки кредитоспособности квалифици­рованных специалистов имеет несколько недостатков: во-первых, их мнение все же субъективно; во-вторых, люди не могут оперативно об­рабатывать большие объемы информации; в-третьих, оплата хороших специалистов требует значительных расходов. Поэтому банки все боль­ше интересуются такими системами оценки риска, которые позволили бы минимизировать участие экспертов и влияние человеческого фак­тора на принятие решений.

Для оценки кредитного риска производится анализ кредитоспособ­ности заемщика, под которой понимается его способность полностью и в срок рассчитаться по своим долговым обязательствам. В соответ­ствии с таким определением основная задача скоринга заключается не только в том, чтобы выяснить, в состоянии клиент выплатить кредит или нет, но и в степени надежности и обязательности клиента.

Скоринг представляет собой математическую или статистическую модель, с помощью которой на основе кредитной истории «прошлых» клиентов банк пытается определить, насколько велика вероятность, что потенциальный заемщик вернет кредит в срок. Скоринг является методом классификации всей интересующей нас популяции на различ­ные группы, когда нам неизвестна характеристика, которая разделяет эти группы, но зато известны другие характеристики.

В западной банковской системе, когда человек обращается за кре­дитом, банк располагает следующей информацией для анализа: анкетой, которую заполняет заемщик; информацией на данного заемщика из кредитного бюро, в котором хранится кредитная история взрослого населения страны; данными движения по счетам, если речь идет о клиенте банка.

Кредитные аналитики оперируют следующими понятиями: «харак­теристики-признаки» клиентов и «градации-значения», которые принимает признак. В анкете клиента характеристиками-признаками яв­ляются вопросы анкеты (возраст, семейное положение, профессия), а градациями-значениями— ответы на эти вопросы. В упрощенном виде скоринговая модель дает взвешенную сумму определенных характери­стик. В результате получают интегральный показатель (score); чем он выше, тем выше надежность клиента (табл.3.). Интегральный показатель каж­дого клиента сравнивается с неким заданным уровнем показателя. Ес­ли показатель выше этого уровня, то выдается кредит, если ниже этой линии, — нет.

Сложность в том, какие характеристики-признаки следует вклю­чать в модель и какие весовые коэффициенты должны им соответ­ствовать. Философия скоринга заключается не в поиске объяснений, почему этот человек не платит. Скоринг использует характеристики, которые наиболее тесно связаны с ненадежностью клиента. Неизвест­но, вернет ли данный заемщик кредит, но известно, что в прошлом люди этого возраста, этой профессии, с таким уровнем образования и числом иждивенцев кредит не возвращали (или возвращали).

Таблица 3. Скоринговая карта

Показатель

Значение

Баллы

Возраст

20 - 25

100

26 - 30

107

31 - 40

123

…………

…………

Доход

1000 - 3000

130

3001 - 5000

145

5001 - 6000

160

…………

…………

Среди преимуществ скоринговых систем западные банкиры указы­вают в первую очередь снижение уровня невозврата кредита. Далее отмечаются быстрота и беспристрастность в принятии решений, воз­можность эффективного управления кредитным портфелем, определе­ние оптимального соотношения между доходностью кредитных опера­ций и уровнем риска.

2.2. Кластерный анализ

Методы кластерного анализа позволяют разбить изучаемую совокупность объектов на группы однородных в некотором смысле объектов, называемых кластерамиили классами. Иерархические и параллельные кластер-процедуры практически реализуемы лишь в задачах классификации не более нескольких десятков наблюдений. К решению задач с большим числом наблюдений (как в наших целях) применяют последовательные кластер-процедуры - это итерационные алгоритмы, на каждом шаге которых используется одно наблюдение (или небольшая часть исходных наблюдений) и результаты разбиения на предыдущем шаге. Идею этих процедур реализована в «SPSS» методе средних («K-Means Clustering») с заранее заданным числом классов.

Алгоритм заключается в следующем: выбирается заданное число k- точек и на первом шаге эти точки рассматриваются как "центры" кластеров. Каждому кластеру соответствует один центр. Объекты распределяются по кластерам по такому принципу: каждый объект относится к кластеру с ближайшим к этому объекту центром. Таким образом, все объекты распределились по k кластерам. Затем заново вычисляются центры этих кластеров, которыми после этого момента считаются покоординатные средние кластеров. После этого опять перераспределяются объекты. Вычисление центров и перераспределение объектов происходит до тех пор, пока не стабилизируются центры.

Если данные понимать как точки в признаковом пространстве, то задача кластерного анализа формулируется как выделение "сгущений точек", разбиение совокупности на однородные подмножества объектов.

При проведении кластерного анализа обычно определяют расстояние на множестве объектов; алгоритмы кластерного анализа формулируют в терминах этих расстояний. Мер близости и расстояний между объектами существует великое множество. Их выбирают в зависимости от цели исследования. В частности, евклидово расстояние лучше использовать для количественных переменных, расстояние хи-квадрат - для исследования частотных таблиц, имеется множество мер для бинарных переменных.

Кластерный анализ является описательной процедурой, он не позволяет сделать никаких статистических выводов, но дает возможность провести своеобразную разведку - изучить "структуру совокупности".

Проведем кластеризацию по всем 20 признакам и всем наблюдениям. В результате работы программы выводится таблица 5. (показана лишь ее часть)

Таблица 5. Cluster Membership

Case Number

Y

Cluster

Distance

…………

……

…………

822

0

0

2985,732

823

1

0

2996,715

824

0

0

3040,706

825

1

0

3054,689

826

0

0

3099,727

827

1

0

3108,674

828

1

1

3100,310

829

1

1

3053,258

830

1

1

3043,285

831

1

1

2991,286

…………

……

………

…………

Столбец Y показывает, относится ли наблюдение к группе вернувших кредит “0” или навернувших “1”, столбец «Cluster» показывает принадлежность к той или иной группе наблюдения на основе кластеризации.

Таблица 6 указывает число наблюдений в том или ином кластере.

Таблица 6. Number of Cases in each Cluster

 

Cluster

1

822,000

 

0

178,000

 
 

Valid

1000,000

 

Missing

,000

Проанализируем качество классификации.

Таблица 7. Expectation-Predictable Table

 

Y=0

Y=1

Всего

всего по выборке

300

700

1000

прогноз

178

822

1000

правильно

65

587

652

неправильно

235

113

348

% правильно

21,7%

83,9%

65,2%

% неправильно

78,3%

16,1%

34,8%

Из таблицы можно видеть, что видеть, что метод позволяет хорошо предугадывать плохие заемы на уровне 83,9%, но плохо предугадывает хорошие заемы – 21,7%. Обычно к методикам выдвигается требование распознавать лучше плохие заемы, т.к. потеря невозврата кредита больше потери неполучения процентов по кредиту.

2.3. Дискриминантный анализ

Кластерный анализ решает задачу классификации объектов при практически отсутствующей априорной информации о наблюдениях внутри классов; в дискриминантном анализе предполагается наличие такой информации. С помощью дискриминантного анализа на основании некоторых признаков (независимых переменных) индивидуум может быть причислен к одной из двух (или к одной из нескольких) заданных заранее групп. Ядром дискриминантного анализа является построение так называемой дискриминантной функция [2]

D=b1*x1+b2*x2+…+bn*xn+a

где х1 и х2 — значения переменных, соответствующих рассматриваемым случаям, константы x1 - xn и а — коэффициенты, которые и предстоит оценить с помощью дискриминантного анализа. Целью является определение таких коэффициентов, чтобы по значению дискриминантной функции можно было с максимальной четкостью провести разделение по группам.

Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Цели ДА – интерпретация межгрупповых различий - дискриминация и методы классификации наблюдений по группам.

При интерпретации мы отвечаем на вопросы: возможно ли, используя данный набор переменных, отличить одну группу от другой, насколько хорошо эти переменные помогают провести дискриминацию, и какие из них наиболее информативны.

Методы классификации связаны с получением одной или нескольких функций, обеспечивающих возможность отнесения данного объекта к одной из групп. Эти функции называются классифицирующими.

Реализуем метод дискриминантного анализа в SPSS. Существует 2 алгоритма классификации:

1. Одновременный учет всех независимых переменных. Результаты представлены в таблице 8

Таблица 8. Classification Results(a)

     

Y

Predicted Group Membership

Total

     

0

1

 

Original

Count

0

218

82

300

   

1

188

512

700

 

%

0

72,7

27,3

100,0

   

1

26,9

73,1

100,0

a 73,0% of original grouped cases correctly classified.

В таблице 9 приведены коэффициенты дискриминантной функции

Таблица 9. Canonical Discriminant Function Coefficients

 

Function

   

1

Z1

,503

Z2

-,127

Z3

,338

Z4

,024

Z5

-,150

Z6

,174

Z7

,134

Z8

-,242

Z9

,225

Z10

,314

Z11

-,006

Z12

-,172

Z13

,035

Z14

,242

Z15

,272

Z16

-,210

Z17

,023

Z18

-,135

Z19

,271

Z20

,611

(Constant)

-3,977

Лямбда Уилкса показывает на значимое различие групп (p < 0,001).

Таблица 10. Wilks' Lambda

Test of Function(s)

Wilks' Lambda

Chi-square

df

Sig.

1

,760

271,399

20

,000

2. Пошаговый метод. При выполнении дискриминантного анализа можно применить пошаговый образ действий, который рекомендуется при наличии большого количества независимых переменных.

Таблица 11. Classification Results(a)

Y

Predicted Group Membership

Total

0

1

Original

Count

0

219

81

300

1

203

497

700

%

0

73,0

27,0

100,0

1

29,0

71,0

100,0

a 71,6% of original grouped cases correctly classified.

Лямбда Уилкса показывает на значимое различие групп (p < 0,001).

Таблица 12. Wilks' Lambda

Test of Function(s)

Wilks' Lambda

Chi-square

df

Sig.

1

,774

254,126

10

,000

В таблице 13 приведены коэффициенты дискриминантной функции

Таблица 13. Canonical Discriminant Function Coefficients

 

Function

   

1

SCHET

,528

SROK

-,140

HISTOR

,315

ZAIM

-,145

CHARES

,186

TIMRAB

,133

VZNOS

-,240

FAMIL

,248

PORUCHIT

,372

INIZAIMI

,262

(Constant)

-3,288

Точность распознавания дискриминантным анализом выше, чем кластерным. Но результаты по-прежнему остаются неудовлетворительными.

2.4. Дерево классификаций

Дерево классификаций является более общим алгоритмом сегмен­тации обучающей выборки прецедентов. В методе дерева клас­сификаций сегментация прецедентов задается не с помощью n-мерной сетки, а путем последовательного дробления факторного пространства на вложенные прямоугольные области (рис .1).

Рис.1. Дерево классификации

На первом шаге разделение выборки прецедентов на сегменты произво­дится по самому значимому фактору. На втором и последующих шагах в отношении каждого из полученных ранее сегментов процедура по­вторяется до тех пор, пока никакой вариант последующего дробления не приводит к существенному различию между соотношением положи­тельных и отрицательных прецедентов в новых сегментах. Количество ветвлений (сегментов) выбирается автоматически.

В рассмотренной методике также не дается ответ, насколько кредит хорош или плох. Метод не позволяют получить точную количествен­ную оценку риска и установить допустимый риск.

2.5. Нейронные сети

Нейронные сети NN используются при определении кредитоспо­собности юридических лиц, где анализируются выборки меньшего раз­мера, чем в потребительском кредите. Наиболее успешной областью их применения стало выявление мошенничества с кредитными карточка­ми. Нейронные сети выявляют нелинейные связи между переменными, которые могут привести к ошибке в линейных моделях. NN позволяют обрабатывать прецеденты обучающей выборки с более сложным (чем прямоугольники) видом сегментов (рис. 2). Форма сегментов зависит от внутренней структуры NN Формулы и коэффициенты модели риска на основе NN лишены физического и логического смысла.

Рис.2. Сегменты разделения «хороших» и «плохих» объектов в NN

Нейросеть — это «черный ящик», внутреннее содержание которого (так называемые веса нейронов) не имеет смысла в терминах оценки риска. Такие методики не позволяют объяснить, почему данному заемщику следует отказать в кредите. NN-модели классификации обладают низкой стабильностью (робастностью).

2.6. Технологии Data mining

В основе технологии data mining лежат алгоритмы поиска закономерностей между различными факторами в больших объемах данных. При этом анализируются зависимости меж­ду всеми факторами; но, поскольку даже при небольшом числе фак­торов количество их всевозможных комбинаций растет экспоненци­ально, в data mining применяются алгоритмы априорного отсечения слабых зависимостей [1]. Говоря терминами анализа кредитоспособности, data mining на основе данных о выданных кредитах выявляет те фак­торы, которые существенно влияют на кредитоспособность заемщика, и вычисляет силу этого влияния. Соответственно, чем сильнее опреде­ленный фактор влияет на кредитоспособность, тем больший балл ему присваивается в методике скоринга. Чем больше данные держателя кредитной карты похожи на данные «кредитоспособного гражданина», тем больший лимит по кредиту он может получить, тем лучшие усло­вия ему могут быть предоставлены

Главное преимущество методик на основе data mining заключается в том, что они могут работать на малых выборках. При больших вы­борках их точность, робастность и прозрачность недостаточны В них также не дается ответ, насколько кредит хорош или плох Метод не позволяет получить количественную оценку риска, установить допу­стимый риск, назначить цену за риск и выявить вклады факторов и их градаций в риск

2.7. Линейная вероятностная регрессионная модель

Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Линейная модель связывает значения зависимой переменной Y со значениями независимых показателей Xk (факторов) формулой:

Y=B0+B1X1+…+BpXp+e

где e - случайная ошибка. Здесь Xk означает не "икс в степени k", а переменная X с индексом k. Традиционные названия "зависимая" для Y и "независимые" для Xk отражают не столько статистический смысл зависимости, сколько их содержательную интерпретацию. Величина e называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами N(0,σ2), ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные X как неслучайные значения, Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения X (например, назначили зарплату работнику), а затем измеряют Y (оценили, какой стала производительность труда). За это иногда зависимую переменную называют откликом. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии:

Построим регрессию Y на факторы Z1-Z20 по методу линейной регрессии (табл.14.)

Таблица 14. Оценка линейной вероятностной модели

В нашем случае прогнозные значения Yf указывают на вероятность возврата (невозврата) кредита. Построим график прогнозных значений (рис.3.)

Рис.3. график прогнозных значений

Можно видеть, что прогнозные значения могут находиться вне интервала [0,1] – это главный недостаток LP модели. Поэтому приступим к построению моделей, лишенных этих недостатков.

2.8. Логистическая регрессия

Будем считать, что событие в данных фиксируется дихотомической переменной (0 не произошло событие, 1 - произошло). Для построения модели предсказания можно было бы построить, к примеру, линейное регрессионное уравнение с зависимой дихотомической переменной Y, но оно будет не адекватно поставленной задаче, так как в классическом уравнении регрессии предполагается, что Y - непрерывная переменная. С этой целью рассматривается логистическая регрессия. Ее целью является построение модели прогноза вероятности события {Y=1} в зависимости от независимых переменных X1,…,Xp. Иначе эта связь может быть выражена в виде зависимости P{Y=1|X}=f(X)

Логистическая регрессия выражает эту связь в виде формулы

, где Z=B0+B1X1+…+BpXp

Название "логистическая регрессия" происходит от названия логистического распределения, имеющего функцию распределения . Таким образом, модель, представленная этим видом регрессии, по сути, является функцией распределения этого закона, в которой в качестве аргумента используется линейная комбинация независимых переменных [3].

Отношение вероятности того, что событие произойдет к вероятности того, что оно не произойдет P/(1-P) называется отношением шансов.

С этим отношением связано еще одно представление логистической регрессии, получаемое за счет непосредственного задания зависимой переменной в виде Z=Ln(P/(1-P)), где P=P{Y=1|X1,…,Xp}. Переменная Z называется логитом. По сути дела, логистическая регрессия определяется уравнением регрессии Z=B0+B1X1+…+BpXp.

В связи с этим отношение шансов может быть записано в следующем виде

P/(1-P)= .

Отсюда получается, что, если модель верна, при независимых X1,…,Xp изменение Xk на единицу вызывает изменение отношения шансов в раз.

Механизм решения такого уравнения можно представить следующим образом

1. Получаются агрегированные данные по переменным X, в которых для каждой группы, характеризуемой значениями Xj= подсчитывается доля объектов, соответствующих событию {Y=1}. Эта доля является оценкой вероятности . В соответствии с этим, для каждой группы получается значение логита Zj.

2. На агрегированных данных оцениваются коэффициенты уравнения Z=B0+B1X1+…+BpXp. К сожалению, дисперсия Z здесь зависит от значений X, поэтому при использовании логита применяется специальная техника оценки коэффициентов - взвешенной регрессии.

Еще одна особенность состоит в том, что в реальных данных очень часто группы по X оказываются однородными по Y, поэтому оценки оказываются равными нулю или единице. Таким образом, оценка логита для них не определена (для этих значений ).

Построим модель пробит для наших данных. Оценивание в SPSS дает результаты (табл.15.), где приведены коэффициенты оценивания.

Таблица 15. Оценка логит-модели

 

B

Step 1(a)

schet

,585

 

srok

-,139

 

histor

,388

 

naznah

,033

 

zaim

-,181

 

chares

,239

 

timrab

,161

 

vznos

-,299

 

famil

,264

 

poruchit

,360

 

timelive

-,005

 

garonti

-,191

 

vozras

,068

 

inizaimi

,315

 

kvartir

,318

 

kolzaim

-,240

 

proff

,021

 

rodstve

-,153

 

telefon

,312

 

inosmest

1,225

 

Constant

-4,227

На основе модели логистической регрессии можно строить предсказание произойдет или не произойдет событие {Y=1}. Правило предсказания, по умолчанию заложенное в процедуру LOGISTIC REGRESSION устроено по следующему принципу: если >0.5 считаем, что событие произойдет; £0.5, считаем, что событие не произойдет (табл.16).

Таблица 16. Таблица прогнозов

Так в нашем примере результаты прогноза можно оформить в виде таблицы 17.

Таблица 17. Прогнозное качество модели

 

Логит модель

 

Y=0

Y=1

Всего

всего по выборке

300

700

1000

прогноз

226

774

1000

правильно

150

624

774

неправильно

150

76

226

% правильно

50,0%

89,1%

77,4%

% неправильно

50,0%

10,9%

22,6%

Результаты подобной классификации превосходят результаты кластерного и дискриминантного анализа.

Заключение

Запишем в таблицу все основные результаты статистическо-эконометрических алгоритмов оценки кредитов для probit модели, кластерного, двух версий дискриминантного анализов, а так же полиномиальные модели.

 

Кластерный анализ.

   
   

Y=0

Y=1

всего

 
 

% правильно

36,67%

82,14%

68,50%

 
 

% неправильно

63,33%

17,86%

31,50%

 
 

Дискриминантный анализ

 
   

Y=0

Y=1

всего

 
 

% правильно

73,67%

72,14%

72,60%

 
 

% неправильно

26,33%

27,86%

27,40%

 
 

Дискриминантный анализ. Пошаговый метод

.

   

Y=0

Y=1

всего

 
 

% правильно

73,33%

71,43 %

72,00%

 
 

% неправильно

26,67%

28,57%

28,00%

 
 

Пробит Логит модели

 
   

Y=0

Y=1

всего

 
 

% правильно

49,00%

88,86%

76,90%

 
 

% неправильно

51,00%

11,14%

23,10%

 
 

Пробит полиномиальная модель

 
 

% правильно

41,67%

92,57%

77,30%

 
 

% неправильно

58,33%

7,43%

22,70%

 

Модель линейной вероятности LP дает прогнозные значения, лежащие вне ин­тервала [0, 1]

Умение распознавать “плохие” кредиты считается наиболее важным качеством модели, т.к. неумение распознать “хорошие кредиты” и недополучение прибыли за счет процентов лучше, чем потеря всей суммы, выданной плохому заемщику. Logit, Probit модели распознают такие кредиты. Дискриминантный анализ распознает “плохие” кредиты лучше других методик на уровне 73,67%.

Кластерный анализ дал наихудшие результаты по распознаванию “плохих” кре­дитов.

Лучшей из всех представленных моделей по распознаванию “хороших” креди­тов является probit-полиномиальная многофакторная модель 1. Уровень распо­знавания составил 77.3%.

Так что для оценки качества кредита целесообразно использовать два алго­ритма: дискриминантный анализ для обнаружения “плохих” кредитов, и probit-полиномиальную многофакторную модель для “хороших” кредитов.

В результате анализа прозрачности методик для оценки кредитных рисков сделаны следующие выводы:

1. применяемые в настоящее время методики недостаточно прозрачны;

2. коммерческие банки испытывают сложности в приобретении (разработке) точных, робастных и прозрачных методик и соответствующих программных средств для оценки кредитных рисков физических и юридических лиц;

3. предлагаемые на рынке западные скоринговые методики и соответствующие программные средства для оценки кредитных рисков физических и юриди­ческих лиц и решения задачи резервирования имеют низкие точность, робастность и прозрачность;

4. необходима разработка более перспективных моделей и соответствующих программных средств для оценки кредитных рисков физических и юридиче­ских лиц, которые обладают существенными преимуществами по точности, робастности, прозрачности и возможности автоматизации анализа, оценки и управления рисками.

Кредитование юридических и физических лиц является одним из основных видов деятельности коммерческих и государственных крупных, средних и мелких банков. Каждый банк индивидуален, так как работает по различным технологи­ям, обслуживает различные сегменты рынка банковских услуг, ориентируется на различные стратегические задачи. Индивидуальности банков способствует также конкуренция.

Кредитный бизнес связан с риском. Условия кредитной деятельности изме­няются, изменяется также допустимый уровень риска. Кредитная деятельность адаптируется к условиям развивающейся экономики страны и уровню жизни ее населения.

Большое значение для обеспечения устойчивого функционирования банка име­ют методы количественной оценки и анализа кредитного риска. Цена за риск должна максимально точно учитывать величину риска каждого кредита. Кроме средней величины риска, определяемой по статистике предыдущей деятельности, банк должен знать количественную оценку и составляющие риска для каждого кредита.

Каждый банк разрабатывает свою модель риска для количественной оценки и анализа риска кредитов с учетом общих рекомендаций Базельского комитета по банковскому надзору. Чем выше точность оценки риска кредитов, тем меньше потери банка, меньше процент за кредит и выше конкурентоспособность банка. От повышения точности и прозрачности методик выигрывает все общество в целом.

Литература

[1] Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и стати­стика, 1989.

[2] Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ ста­тистических данных и восстановление скрытых закономерностей: Пер.с нем. - СПб.: ООО “ДиаСофтЮП”, 2001. - 608с.

[3] Васютович А., Сотникова Ю. Рыночный риск: измерение и управление. Бан­ковские технологии.- 1998.- 1.

[4] Введение в управление кредитным риском. Прайс-Уотерхаус: 1994.

[5] Внутренняя методика определения категории финансового положения заемщика-эмитента. Решение Правления ОАО “ПСБ” от 4.08.2004.

[6] Головань СВ., Евдокимов М.А., Карминский А.М., Пересецкий А.А. Модели вероятности дефолта российских банков. Влияние макроэкономических фак­торов на устойчивость банков. Препринт 2004/043 Ч Российская экономиче­ская школа, 2004.

[7] Дубров А. М., Мхитарян В. С, Трошин Л. И. Многомерные статистические методы: Учебник. - М.: Финансы и статистика, 2000. - 352 с.

[8] Киселева И. А. Моделирование рисковых ситуаций: учебно-практическое по­собие. Евразийский открытый институт. - М.: МЭСИ, 2007.-102с.

[9] Колмогоров А. Н., Драганов А. Г. Введение в математическую логику. М.: МГУ, 1982

[10] Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. Дело, 2004.

[11] Маршал Дж. Ф., Бансал В. К. Финансовая инженерия. Полное руководство по финансовым нововведениям. М.: ИНФРА, 1998.

[12] Михайлов Л, Сычева Л, Тимофеев Е. Бан ковский кризис 1998 года в России и его последствия. М.: ИЭПП, 2000. Ч С. 40.

[13] Первозванский А. А., Первозванская Т. Н. Финансовый рынок: расчет и риск. М.: Инфра, 1994.

[14] Пересецкий А.А., Карминский А.М., А.Г.О. Ван Суст. Моделирование рей­тингов российских банков. Экономика и математические методы, 40(4), 2004. Ч С. 10425.

[15] Рябинин И. А. Надежность и безопасность структурно-сложных систем. СПб.: Политехника, 2000.

[16] Харин Ю.С., Малюгин В.И., Харин А.Ю. Эконометрическое моделирование. Минск, БГУ, 2003.

[17] Ширяев А. Н. Основы стохастической финансовой математики: в 2-х т.-М.: Фазис, 1998.

[18] Энциклопедия финансового риск-менеджмента. Под ред. А.А. Лобанова, А.В. Чугунова. Ч 2-е изд. М.: Альпина Бизнес Букс, 2006.

[19] Demirguc-Kunt A., Detragiache E. The determinants of banking crisis evidence from developing and developed countries. IMF Working Paper 97 .106. International money Fund, 1997.

[20] Greene W. Econometric Analysis. New York: Macmillan Publishing Company, 1993.

[21] Gonzalez-Hermosillo B., Determinants of ex ante banking system distress: A macro-micro empirical exploration of some recent episodes. IMF Working Paper 99. 33. International money Fund, 1999.

[22] Kaminsky G., LizondoS., Reinhart CM. The leading indicators of currency crises. IMF Staf Paper 6390. National Bureau of Economic research, 2000.

[23] Maddala G. S. Limited-dependent and qualitative variables in econometrics. Cambridge. 1991.

[24] Sahajwala R., Van der Bergh P. Supervisory risk assessment and early warning systems. Basel committee on banking supervision Working Paper. No. 4, December, 2000. 4 53 p

[25] Tornell A. Lending boom and currency crisis: Empirical Links. NBER Working Paper No. 7340. National Bureau of Economic Research, 1999.