Автор работы: Пользователь скрыл имя, 27 Августа 2011 в 15:52, автореферат
Актуальность темы исследования. Современный российский рынок банковских услуг насчитывает немногим более 1000 кредитных организаций. При этом, средней величины банковская сеть в крупном городе может обслуживать более 200 тысяч клиентов. Данные показатели не являются предельными, так как в России банковская система находится только в начале своего развития и ее история охватывает всего несколько десятков лет.
рис.1 Байесовская сеть доверия для определения надежности банка.
Проверку на значимость не прошли следующие факторы: отношение объема просроченных ссуд к объему ссуд нефинансовым организациям, отношение объемов обязательств перед нерезидентами к активам, отношение портфеля негосударственных ценных бумаг к активам, отношение объема средств клиентов к активам.
Как инструмент оценки надежности банка предлагается наивный байесовский классификатор, основанный на предположении о независимости всех объясняющих переменных (без данного предположения байесовский классификатор называется идеальным). Этот классификатор использует теорему Байеса для определения вероятности принадлежности к одному из классов (надежности/ненадежности) при условии того, что наблюдаемые переменные принимают заданные значения .
Вероятностная модель для классификатора — это условная модель, имеющая вид:
где – эндогенная переменная, отражающая принадлежность к классу
– экзогенные переменные, выбранные показатели банковской отчетности и иная информация.
Используя теорему Байеса, можно записать:
Для
дальнейшего анализа
Числитель эквивалентен совместной вероятности модели:
Она может быть выражена следующим образом, используя повторные приложения определений условной вероятности:
Теперь исходя из наивных предположений об условной независимости, выводится, что каждое свойство условно независимо от любого другого свойства при . Это означает, что
Таким образом, совместная модель может быть выражена как
Это означает, что из предположения о независимости, условное распределение по классовой переменной может быть выражено следующим образом:
где — это масштабный множитель, зависящий только от , то есть является константой, если значения переменных известны.
Преимуществом наивного байесовского классификатора является требование к размеру выборки. Исследования показали, что незначительные отклонения от предположения о независимости факторов приводят к незначительному отклонению от результата работы идеального классификатора. Даже в случае существенного нарушения предположения о независимости между переменными, результат будет коррелировать с истинной принадлежностью наблюдаемого явления к классу.
Байесовский классификатор может быть записан через плотности вероятностей. Имеется множество объектов и конечное множество имен классов . Множество прецедентов является вероятностным пространством с плотностью распределения .
— априорная вероятность класса
— плотность распределения условной вероятности или, так называемая, функция правдоподобия.
Если плотности распределений известны, то можно построить алгоритм, выбирающий класс по максимальной апостериорной вероятности.
Когда имеется в наличии набор данных , где , выбранных случайным образом и независимо из неизвестного распределения , расчету вероятностей классов будет предшествовать процедура оценки априорной вероятности классов и функции правдоподобия для каждого из классов , которые приближали бы вероятности и функции на всем множестве .
Такая задача не будет иметь единственного решения, так как многие распределения с функцией плотности могли бы сгенерировать выборку . Для восстановления плотности можно использовать различные методы.
Априорную вероятность классов оценить по имеющемуся набору данных гораздо легче:
Где количество элементов выборки, принадлежащих классу
количество элементов всей выборки.
В рамках данного исследования априорная вероятность принадлежности к классу определяется наличием фактов отзыва лицензии у банка.
В
диссертации приведены
В
методе фильтрации каждому фактору
приписывается уровень
где – весовой коэффициент, характеризующий значимость рассматриваемого фактора при проведении процедуры классификации.
Метод фильтрации сводится к оцениванию данных весов. Для факторов, которые подозреваются в нарушении предположения о независимости, устанавливаются меньшие веса, чем для факторов независимым вкладом в классификацию.
Метод свертывания может из двух зависимых друг от друга факторов выбирать один, или заменять оба фактора на общий составной показатель. В силу самой специфики построения метода свертывания, он приводит к улучшению наивного байесовского классификатора. Процедура обработки входящей информации может производиться до тех пор, пока не следующее изменение уже не будет давать улучшение точности классификатора. На каждом шаге анализа факторов выбирается первые пар факторов с наибольшей мерой зависимости. Зависимость предполагается линейной. Из выбранных факторов остается один. Процесс повторяется до тех пор, пока точность наивного байесовского классификатора не будет улучшаться. Таким образом, точность наивного байесовского классификатора выступает как инструмент оценки проводимых преобразований множества факторов.
В третьей главе произведен расчет оценки надежности банков по двенадцати моделям, составленным с помощью трех методов определения законов распределения факторов: с предположением о нормальном распределении факторов ( ), с подбором законов распределения факторов ( ),с дискретизацией факторов ( ), и двух методов предобработки данных фильтрации ( ) и свертывания ( )и их комбинаций ( ).
Качество работы классификаторов определяется количеством совпадений с тестовой выборкой. Чем больше совпадений с тестовой выборкой, тем выше качество классификатора. Выделены два типа ошибок классификации. Ошибкой первого рода является признание надежного банка ненадежным, ошибкой второго рода является признание ненадежного банка надежным. В рамках исследования более важным является минимизация ошибок второго рода, так как в этом случае решение, принятое на основе такого результата, может быть причиной больших потерь. Тогда как ошибку первого рода можно считать перестраховкой. Для случая непрерывной случайной величины меры надежности банка вводится коэффициент принадлежности к классу. Данный коэффициент равен отношению значения функции плотности распределения апостериорной вероятности надежного класса к значению функции плотности распределения апостериорной вероятности ненадежного класса.
Чем выше коэффициент, тем более вероятным является то, что рассматриваемый банк является надежным. Коэффициент показывает степень уверенности в полученной классификации.
Результаты проверки классификаторов на тестовом множестве представлены в таблице 2.
Таблица 2. Результаты работы классификаторов
Классификатор | Количество правильных классификаций | Количество ошибок первого рода | Количество ошибок второго рода | Исключенные факторы |
13 | 7 | 0 | ||
13 | 7 | 0 | ||
14 | 6 | 0 | 1, 3, 7 | |
17 | 3 | 0 | 1, 3, 6, 7, 8 | |
13 | 5 | 2 | ||
12 | 3 | 5 | ||
15
15 |
4
5 |
1
0 |
1, 2
1, 2, 9 | |
15
15 |
2
0 |
3
5 |
2, 4, 5, 9
1, 2, 4, 8, 9 | |
14 | 2 | 4 | ||
11 | 2 | 7 | ||
14 | 2 | 4 | 2, 4, 9, 11 | |
13 | 0 | 7 | 3, 7, 10, 11 |
Наиболее качественным классификатором оказался . Он обеспечивает наименьшее количество ошибок второго рода и наибольшее число удачных классификаций. Также приемлемые результаты дал метод .
По предложенному подходу к оценке надежности банка была составлена методика оценки надежности. В общей сложности она реализуется в несколько этапов:
После этого модель готова к использованию для оценки надежности конкретного банка:
В итоговом расчете оценки надежности банка может так получиться, что вероятность принадлежности к надежному классу будет равна или близка 0,5 (50%). Такая ситуация характеризуется неопределенностью, поэтому для того, чтобы клиенту банка произвести конкретный выбор необходимо задать границы значений вероятности. Предлагается для приоритета выбора основывать на надстройке к шкале значений надежности, сформированной по следующему принципу. Высоконадежными банками будут являться банки с вероятностью отнесения к надежному классу более 90%. Банки второго уровня надежности – надежные банки – с вероятностью принадлежности к надежному классу от 70% до 90%. Банки с вероятностью принадлежности к классу менее 70%, но более 50% следует отнести к неопределенной группе – к условнонадежным банкам. Банки с вероятностью отнесения к надежному классу менее 50% следует признавать ненадежными банками.
В непрерывном случае для коэффициента уровни могут быть заданы соответственно: для банков первой группы – более 9, для второй группы – от 2.4 до 9. Банки со значением менее 2.4, но более 1 следует отнести к возможно надежным банкам. Если меньше 1, то банк относится к ненадежной группе.
Информация о работе Вероятностное моделирование надежности коммерческого банка