Автор работы: Пользователь скрыл имя, 01 Декабря 2011 в 17:52, курсовая работа
Цель исследования состоит в анализе теоретических положений и методологических основ применения метода дерева решений в процессе принятия решений для достижений целей организации в современных условиях.
Для достижения данной цели были поставлены следующие задачи:
определить сущность и содержание метода дерева решений, его место и роль в достижении цели;
рассмотреть методологические основы применения метода;
определить принципы и методы оценки эффективности метода;
проследить алгоритм построения дерева решений на примере оценки кредитного риска Банком Москвы.
Введение
1 Применение метода дерева решений для принятия решений
1.1 Необходимость выбора альтернатив
1.2 Дерево решений
1.3 Порядок построения дерева решений
1.4 Преимущества деревьев решений
2 Применение дерева решений для снижения кредитного риска на примере Банка Москвы
2.1 Характеристика ОАО " Банка Москвы"
2.2 Анализ кредитоспособности клиента при помощи методики дерева решений
Заключение
Список литературы
Прогнозы полезны для планирования и осуществления деловых операции только в том случае, если компоненты прогноза тщательно продуманы, а ограничения, содержащиеся в прогнозе, откровенно названы. Существует несколько способов сделать это:
Спросите себя, для чего нужен прогноз, какие решения будут на нем основаны. Этим определяется потребная точность прогноза. Некоторые решения принимать опасно, даже если возможная погрешность прогноза – менее 10%. Другие решения можно принимать безбоязненно даже при значительно более высокой допустимой ошибке.
Определите изменения, которые должны произойти, чтобы прогноз оказался достоверным. Затем с осмотрительностью оцените вероятность соответствующих событий.
Определите компоненты прогноза. Подумайте об источниках данных.
Определите,
насколько ценен опыт прошлого в
составлении прогноза. Не настолько
ли быстры изменения, что основанный
на опыте прогноз будет
Определите,
насколько структурированным
Используя дерево решений, руководитель находит путем возврата от второй точки к началу наиболее предпочтительное решение – наращивание производственных мощностей под выпуск косилок обоих типов. Это обусловлено ожидаемым выигрышем (3 млн. долл.), который превышает выигрыш (1 млн. долл.) при отказе от такого наращивания, если в точке А будет низкий спрос на электрические косилки.
Руководитель продолжает двигаться назад к текущему моменту (первой точке принятия решений) и рассчитывает ожидаемые значения в случаях альтернативных действий – производства только электрических или только ручных косилок. Ожидаемое значение для варианта производства только электрических косилок составляет 6,5 млн. долл. (0,7 х 8 млн. долл. + 0,3 х 3 млн. долл.). Подобным образом рассчитывается ожидаемое значение для варианта выпуска только ручных косилок, которое равно всего 4,4 млн. долл. Таким образом, наращивание производственных мощностей под выпуск косилок обоих типов является наиболее желательным решением, поскольку ожидаемый выигрыш здесь наибольший, если события пойдут, как предполагается.7
Дерево решений позволяет представить проблему схематично и сравнить возможные альтернативы визуально. Этот метод можно использовать в применении к сложным ситуациям, когда результат принимаемого решения влияет на последующие.
В наиболее простом виде дерево решений – это способ представления правил в иерархической, последовательной структуре. Основа такой структуры – ответы "Да" или "Нет" на ряд вопросов.
На рис. 2 приведен классический пример дерева решений, задача которого – ответить на вопрос: "Играть ли в гольф?"8 Чтобы решить задачу, т.е. принять решение, играть ли в гольф, следует отнести текущую ситуацию к одному из известных классов (в данном случае – "играть" или "не играть"). Для этого требуется ответить на ряд вопросов, которые находятся в узлах этого дерева, начиная с его корня.
Первый узел нашего дерева "Солнечно?" является узлом проверки, т.е. условием. При положительном ответе на вопрос осуществляется переход к левой части дерева, называемой левой ветвью, при отрицательном – к правой части дерева. Таким образом, внутренний узел дерева является узлом проверки определенного условия. Далее идет следующий вопрос и т.д., пока не будет достигнут конечный узел дерева, являющийся узлом решения. Для нашего дерева существует два типа конечного узла: "играть" и "не играть" в гольф.
В результате прохождения от корня дерева (иногда называемого корневой вершиной) до его вершины решается задача классификации, т.е. выбирается один из классов – "играть" и "не играть" в гольф.
Целью построения дерева решения в нашем случае является определение значения категориальной зависимой переменной.
Итак, основными элементами дерева решений являются:
Корень
дерева: "Солнечно?"
Рис.2.
Дерево решений "Играть ли в гольф?"
Внутренний узел дерева или узел проверки: "Температура воздуха высокая?", "Идет ли дождь?"
Лист, конечный узел дерева, узел решения или вершина: "Играть", "Не играть"
Ветвь дерева (случаи ответа): "Да", "Нет".
В рассмотренном примере решается задача бинарной классификации, т.е. создается дихотомическая классификационная модель. Пример демонстрирует работу так называемых бинарных деревьев.
В узлах бинарных деревьев ветвление может вестись только в двух направлениях, т.е. существует возможность только двух ответов на поставленный вопрос ("да" и "нет").
Бинарные деревья являются самым простым, частным случаем деревьев решений. В остальных случаях, ответов и, соответственно, ветвей дерева, выходящих из его внутреннего узла, может быть больше двух.
Рассмотрим более сложный пример. База данных, на основе которой должно осуществляться прогнозирование, содержит следующие ретроспективные данные о клиентах банка, являющиеся ее атрибутами: возраст, наличие недвижимости, образование, среднемесячный доход, вернул ли клиент вовремя кредит. Задача состоит в том, чтобы на основании перечисленных выше данных (кроме последнего атрибута) определить, стоит ли выдавать кредит новому клиенту.
Как мы уже рассматривали в лекции, посвященной задаче классификации, такая задача решается в два этапа: построение классификационной модели и ее использование.
На этапе построения модели, собственно, и строится дерево классификации или создается набор неких правил. На этапе использования модели построенное дерево, или путь от его корня к одной из вершин, являющийся набором правил для конкретного клиента, используется для ответа на поставленный вопрос "Выдавать ли кредит?"
Правилом является логическая конструкция, представленная в виде "если : то :"
На рис. 3. приведен пример дерева классификации, с помощью которого решается задача "Выдавать ли кредит клиенту?". Она является типичной задачей классификации, и при помощи деревьев решений получают достаточно хорошие варианты ее решения.
Как видно из рисунка, внутренние узлы дерева (возраст, наличие недвижимости, доход и образование) являются атрибутами описанной выше базы данных. Эти атрибуты называют прогнозирующими, или атрибутами расщепления. Конечные узлы дерева, или листы, именуются метками класса, являющимися значениями зависимой категориальной переменной "выдавать" или "не выдавать" кредит.
Каждая ветвь дерева, идущая от внутреннего узла, отмечена предикатом расщепления. Последний может относиться лишь к одному атрибуту расщепления данного узла. Характерная особенность предикатов расщепления: каждая запись использует уникальный путь от корня дерева только к одному узлу-решению. Объединенная информация об атрибутах расщепления и предикатах расщепления в узле называется критерием расщепления.
На рис3. изображено одно из возможных деревьев решений для рассматриваемой базы данных. Например, критерий расщепления "Какое образование?", мог бы иметь два предиката расщепления и выглядеть иначе: образование "высшее" и "не высшее". Тогда дерево решений имело бы другой вид.
Таким
образом, для данной задачи (как и
для любой другой) может быть построено
множество деревьев решений различного
качества, с различной прогнозирующей
точностью.
Рис.
3 Дерево решений "Выдавать ли кредит?"
Качество построенного дерева решения весьма зависит от правильного выбора критерия расщепления. Над разработкой и усовершенствованием критериев работают многие исследователи.
Метод деревьев решений часто называют "наивным" подходом. Но благодаря целому ряду преимуществ, данный метод является одним из наиболее популярных для решения задач классификации.
Интуитивность деревьев решений. Классификационная модель, представленная в виде дерева решений, является интуитивной и упрощает понимание решаемой задачи. Результат работы алгоритмов конструирования деревьев решений, в отличие, например, от нейронных сетей, представляющих собой "черные ящики", легко интерпретируется пользователем. Это свойство деревьев решений не только важно при отнесении к определенному классу нового объекта, но и полезно при интерпретации модели классификации в целом. Дерево решений позволяет понять и объяснить, почему конкретный объект относится к тому или иному классу.
Деревья решений дают возможность извлекать правила из базы данных на естественном языке. Пример правила: Если Возраст > 35 и Доход > 200, то выдать кредит.
Деревья решений позволяют создавать классификационные модели в тех областях, где аналитику достаточно сложно формализовать знания.
Алгоритм конструирования дерева решений не требует от пользователя выбора входных атрибутов (независимых переменных). На вход алгоритма можно подавать все существующие атрибуты, алгоритм сам выберет наиболее значимые среди них, и только они будут использованы для построения дерева. В сравнении, например, с нейронными сетями, это значительно облегчает пользователю работу, поскольку в нейронных сетях выбор количества входных атрибутов существенно влияет на время обучения.
Точность моделей, созданных при помощи деревьев решений, сопоставима с другими методами построения классификационных моделей (статистические методы, нейронные сети).
Разработан ряд масштабируемых алгоритмов, которые могут быть использованы для построения деревьев решения на сверхбольших базах данных; масштабируемость здесь означает, что с ростом числа примеров или записей базы данных время, затрачиваемое на обучение, т.е. построение деревьев решений, растет линейно. Примеры таких алгоритмов: SLIQ, SPRINT.
Быстрый процесс обучения. На построение классификационных моделей при помощи алгоритмов конструирования деревьев решений требуется значительно меньше времени, чем, например, на обучение нейронных сетей.
Большинство
алгоритмов конструирования деревьев
решений имеют возможность
Многие классические статистические методы, при помощи которых решаются задачи классификации, могут работать только с числовыми данными, в то время как деревья решений работают и с числовыми, и с категориальными типами данных.
В процессе построения дерева, чтобы его размеры не стали чрезмерно большими, используют специальные процедуры, которые позволяют создавать оптимальные деревья, так называемые деревья "подходящих размеров".
Какой размер дерева может считаться оптимальным? Дерево должно быть достаточно сложным, чтобы учитывать информацию из исследуемого набора данных, но одновременно оно должно быть достаточно простым. Другими словами, дерево должно использовать информацию, улучшающую качество модели, и игнорировать ту информацию, которая ее не улучшает.
Тут существует две возможные стратегии. Первая состоит в наращивании дерева до определенного размера в соответствии с параметрами, заданными пользователем. Определение этих параметров может основываться на опыте и интуиции аналитика, а также на некоторых "диагностических сообщениях" системы, конструирующей дерево решений.
Вторая
стратегия состоит в
Процедуры, которые используют для предотвращения создания чрезмерно больших деревьев, включают: сокращение дерева путем отсечения ветвей; использование правил остановки обучения.
Информация о работе Применение дерева решений для снижения кредитного риска на примере Банка Москвы