Искусственный интелект

Автор работы: Пользователь скрыл имя, 20 Мая 2013 в 20:04, курсовая работа

Краткое описание

В рамках бакалаврской работы был рассмотрен метод распознавания графических образов с шумами, основанный на применении нейронной сети Хемминга. Было рассмотрено влияние шумов в данных на результат работы сети.
Также в рамках работы был построен программный комплекс, реализующий данный метод и позволяющий анализировать сгенерированные последовательности данных с внесённым в них шумом. Шум является случайной величиной и имеет заданный закон распределения. Были проведены исследования и на основе их результатов были сформулированы выводы.

Содержимое работы - 1 файл

Доклад ИИ.docx

— 1.85 Мб (Скачать файл)

Аннотация

В рамках бакалаврской работы был рассмотрен метод распознавания графических образов с шумами, основанный на применении нейронной сети Хемминга. Было рассмотрено влияние шумов в данных на результат работы сети.

Также в рамках работы был построен программный комплекс, реализующий данный метод и позволяющий анализировать сгенерированные последовательности данных с внесённым в них шумом. Шум является случайной величиной и имеет заданный закон распределения. Были проведены исследования и на основе их результатов были сформулированы выводы.

 

The Annotation

As part of the Bachelor was the method of recognition of graphic images with noise, based on the application of the Hamming neural network. It was the influence of noise in the data at the output of the network.

Also as part of the software system has been built that implements this method and allows to analyze the sequence data generated from the noise made ​​by them. Noise is a random variable and has given law of distribution. Studies have been conducted on the basis of their results have been formulated conclusions. 

Оглавление

Введение 8

Постановка задачи 10

1. Системный анализ методов распознавания образов и построения генераторов псевдослучайных величин. 11

1.1. Анализ методов распознавания графических образов 11

1.1.1 Статистические методы распознавания 11

1.1.2 Структурные (лингвистические) методы распознавания 13

1.1.3 Нейросетевые методы распознавания 16

1.1.4 Вывод по результатам анализа рассмотренных методов 19

1.2. Генератор псевдослучайных величин 21

1.2.1. Генератор псевдослучайных величин, построенный методом обратной функции (непрерывная величина). 21

1.2.2. Генератор псевдослучайных величин, построенный методом обратной функции (дискретная величина). 22

1.2.3. Генератор псевдослучайных величин, построенный универсальным методом. 23

1.2.4. Проверка качества случайных величин 24

1.3. Процедура искажения изображений 28

1.3.1 Преобразование Бокса – Мюллера. 28

1.4. Выводы 30

2. Реализация эмулятора нейронной сети Хемминга, решающей задачи распознавания зашумлённых образов. 31

2.1. Выбор структуры ИНС 33

2.2. Программная реализация ИНС 35

2.2.1. Интерфейс пользователя программы-эмулятора ИНС 39

2.3. Описание программного генератора случайных величин 41

2.3.1. Интерфейс пользователя программного генератора случайных величин 42

2.4. Выводы 45

3. Исследование результатов работы генератора псевдослучайной величины 46

3.1 Метод обратной функции для непрерывной случайной величины. 47

3.2 Метод обратной функции для дискретной случайной величины. 51

3.3 Генерация псевдослучайной величины универсальным методом 53

3.4 Выводы 57

4. Исследование результатов работы программы-эмулятора ИНС 59

4.1 Выводы 61

Заключение 62

Библиографический список 63

Приложение А. Генератор ПСВ. 65

Приложение B.Эмулятор НС Хемминга. 71

 

 

Введение

 

 

Проблема  эффективного распознавания и анализа  изображений является актуальной в настоящее время в сферах автоматизации процессов человеческой деятельности, связанных с идентификацией различных объектов окружающего мира, например, авторизация по отпечаткам пальцев, сетчатке глаза или другим биометрическим признакам, считывание текста, распознавание лиц, жестов, автомобильных номеров и многое другое. Данная проблема не потеряет своей актуальности и в будущем, так как высокий темп развития уровня компьютеризации в области получения графической информации требует создания различных методов их анализа и распознавания.

В настоящее  время предложено большое количество нейросетевых моделей для решения задачи распознавания образов. Одним из главных преимуществ нейронных сетей (НС), свидетельствующим об их широких прикладных возможностях, является возможность параллельной обработки информации всеми нейронами. Благодаря этой способности при большом количестве межнейронных связей достигается значительное ускорение процесса обработки информации [1].

НС более устойчивы, чем другие статистические методы при распознавании изображений, если образы подвержены искажению. Отклик сети после обучения может быть до некоторой степени нечувствителен к небольшим изменениям входных сигналов. Эта внутренне присущая способность видеть образ сквозь шум и искажения важна для распознавания образов в реальном мире. Она позволяет преодолеть требование строгой точности, предъявляемое обычным компьютером. Важно отметить, что НС делает обобщения автоматически благодаря своей структуре, а не с помощью использования «человеческого интеллекта» в форме специально написанных компьютерных программ [2].

Уникальное свойство НС – универсальность. Хотя почти для всех вышеперечисленных задач существуют эффективные математические методы решения и, несмотря на то, что НС проигрывают специализированным методам для конкретных задач, благодаря универсальности и перспективности для решения глобальных задач, например, построения искусственного интеллекта и моделирования процесса мышления, они являются важным направлением исследования, требующим тщательного изучения.

Искусственные нейронные сети (НС) – набор математических и алгоритмических методов для решения широкого круга задач. Они превосходят последовательные машины в решении тех же задач, в которых машину превосходит человек. К задачам, успешно решаемым НС на данном этапе их развития, относятся [1]:

    • Распознавание зрительных и слуховых образов: от распознавания текста до систем голосового управления.
    • Ассоциативный поиск информации и создание ассоциативных моделей: синтез речи, формирование естественного языка.
    • Формирование моделей различных нелинейных и трудно описываемых математически систем, а также прогнозирование развития этих систем во времени: прогнозирование развития различных природных процессов, изменений курсов валют, курсов акций и других финансовых показателей.
    • Системы управления и регулирования с предсказанием: управление роботами и другими сложными устройствами.
    • Разнообразные конечные автоматы: системы массового обслуживания и коммутации, телекоммуникационные системы.
    • Принятие решений и диагностика, исключающие логический вывод; особенно в областях, где отсутствуют четкие математические модели: в медицине, криминалистике, финансовой сфере и т.д.

Актуальность  исследований в направлении НС подтверждается большим количеством их различных применений.

Целью данной работы является создание программного обеспечения, реализующего построение генераторов псевдослучайных величин (ПСВ) с заданными законами распределения с возможностью исследования эффективности их работы и моделирование работы НС Хемминга, решающей задачи распознавания искаженных данных, шумы для которых формируются генераторами ПСВ.

 

Постановка  задачи

 

  1. Цель работы

 

Целью работы по построению генераторов псевдослучайной величины (ПСВ) и моделированию работы НС Хемминга с шумами в данных является разработка программного комплекса, позволяющего:

    • строить генераторы ПСВ с заданными законами распределения с возможностью исследования эффективности их работы;
    • моделировать работу нейронной сети Хемминга, решающей задачи распознавания искаженных данных, шумы для которых формируются генераторами ПСВ.

 

    1. Задачи

 

Для достижения поставленной цели в рамках данной работы, по построению генераторов ПСВ и моделированию работы НС Хемминга с шумами в данных являются:

-    построение эмулятора нейронной  сети Хемминга 

    • обучение нейронной сети Хемминга эталонным изображениям;
    • исследование качества распознавания искаженных изображений нейронной сетью Хемминга.
    • построение генераторов ПСВ тремя методами;
    • исследование эффективности работы генераторов ПСВ и представление результатов исследований в графическом виде;
    • искажение изображений с использованием генераторов ПСВ;

 

  1. Системный анализ методов распознавания образов и построения генераторов псевдослучайных величин.
    1.   Анализ методов распознавания графических образов

 

Проблема  эффективного распознавания образов  имеет важное значение в сферах автоматизации  определенных процессов человеческой деятельности, связанных с идентификацией различных объектов окружающего  мира, например, авторизация рабочего персонала по отпечаткам пальцев  или сетчатке глаза, идентификация  продукта и расчет цены в магазине по штрих-коду и так далее.

Основные  причины замены человеческого участия  в задачах распознавания:

- Освобождение человека от однообразных операций для решения других более важных задач.

- Повышение качества и скорости принимаемых решений.

Актуальность  настоящей темы обусловлена, с одной  стороны, большим интересом к  системам распознавания образов  в современной науке, с другой стороны, ее недостаточной разработанностью.

Различают три  основных группы методов распознавания [3,4]:

1. Статистические

2.Структурные

3. Нейросетевые  методы.

Далее будет  рассмотрена каждая группа методов, определены недостатки и преимущества каждого метода, а также выбран один из методов для распознавания  графических образов в данной работе.

 

 

1.1.1 Статистические методы распознавания

 

Сравнение объектов можно производить на основе их представления  в виде векторов измерений. Допустим, что каждый объект представлен в  точности d результатами измерений. У каждого объекта А i-я координата такого вектора признаков имеет один и тот же смысл. Например, первая координата может быть площадью объекта, вторая — моментом второго порядка по строке, третья координата — это протяженность объекта и так далее. Данные измерений удобно представлять в виде вещественных чисел. Сходство (близость) векторов признаков двух объектов может быть описано с помощью евклидова расстояния между векторами.  

Статистический  подход основывается на математических правилах классификации, которые формулируются и выводятся в терминах  математической  статистики. Этот метод обеспечивает получение классификатора в тех случаях, когда известны плотности распределения для всех совокупностей образов и вероятности появления образов для каждого класса.

В распознавании  образов неизвестный объект для  классификации представляется в  виде вектора элементарных признаков. Система распознавания на основе векторов признаков может быть разработана различными способами — эти векторы могут быть известны системе в результате обучения или предсказаны на основе каких-либо моделей.

Система распознания  на основе векторов признаков может  быть разработана двумя различными способами – эти векторы могут  быть известны системе в результате обучения или предсказаны на основе каких-либо моделей. Далее будут  рассмотрены два альтернативных метода использования базы данных эталонных  образцов, сформированных в результате обучения системы[3].

 

1)Классификация по ближайшему среднему значению

Алгоритм  классификации заключается в  группировке эталонных данных каждого класса с использованием вектора математического ожидания  класса,

     

где j - эталонный вектор признаков для класса i. Неизвестный объект с вектором признаков х относится к классу i, если он существенно ближе к вектору математического ожидания класса i, чем к векторам математических ожиданий других классов. Вектор х можно отнести к классу выбросов, если он не лежит достаточно близко к одному из векторов математических ожиданий. Этот метод классификации прост и быстро работает, он подходит для задач, в которых точки каждого класса располагаются компактно и далеко от других классов.

Простой пример с двумя классами с двумерными векторами представлен на рисунке 1.

Рисунок 1. Два компактных класса.

 

При данной структуре классов коэффициент  ошибок будет небольшим, если только структура эталонных образцов хорошо представляет структуру распознаваемых системой объектов. Трудности могут  возникнуть, если классы эталонных  образцов обладают сложной структурой или пересекаются[3].

2)Классификация по расстоянию до ближайших соседей

Более гибкий, но одновременно более долгий метод классификации заключается в отнесении неизвестного вектора признаков х к тому классу, к отдельному эталонному образцу которого этот вектор наиболее близок. Это правило ближайшего соседа. Классификация по ближайшему соседу может быть эффективна, даже если классы имеют сложную структуру и когда классы перекрываются. При таком подходе не требуется предположений о моделях распределения векторов признаков в пространстве; алгоритм предполагает использование только известных эталонных образов. Метод основан на вычислении расстояния от x до всех образцов в базе данных и нахождении минимального расстояния. Преимущество такого подхода в том, что новые маркированные образцы можно в любой момент добавлять в базу данных. Существуют структуры данных, позволяющие сократить количество вычисляемых расстояний. Примерами таких структур являются древовидные и сеточные структуры данных, описанные в [3].

Информация о работе Искусственный интелект