Автор работы: Пользователь скрыл имя, 20 Мая 2013 в 20:04, курсовая работа
В рамках бакалаврской работы был рассмотрен метод распознавания графических образов с шумами, основанный на применении нейронной сети Хемминга. Было рассмотрено влияние шумов в данных на результат работы сети.
Также в рамках работы был построен программный комплекс, реализующий данный метод и позволяющий анализировать сгенерированные последовательности данных с внесённым в них шумом. Шум является случайной величиной и имеет заданный закон распределения. Были проведены исследования и на основе их результатов были сформулированы выводы.
Аннотация
В рамках бакалаврской работы был рассмотрен метод распознавания графических образов с шумами, основанный на применении нейронной сети Хемминга. Было рассмотрено влияние шумов в данных на результат работы сети.
Также в рамках работы был построен программный комплекс, реализующий данный метод и позволяющий анализировать сгенерированные последовательности данных с внесённым в них шумом. Шум является случайной величиной и имеет заданный закон распределения. Были проведены исследования и на основе их результатов были сформулированы выводы.
The Annotation
As part of the Bachelor was the method of recognition of graphic images with noise, based on the application of the Hamming neural network. It was the influence of noise in the data at the output of the network.
Also as part of the
software system has been built that implements this method and allows
to analyze the sequence data generated from the noise made by
them. Noise is a random variable and has given law of distribution.
Studies have been conducted on the basis of their results have been
formulated conclusions.
Оглавление
Введение 8
Постановка задачи 10
1. Системный анализ методов распознавания образов и построения генераторов псевдослучайных величин. 11
1.1. Анализ методов распознавания графических образов 11
1.1.1 Статистические методы распознавания 11
1.1.2 Структурные (лингвистические) методы распознавания 13
1.1.3 Нейросетевые методы распознавания 16
1.1.4 Вывод по результатам анализа рассмотренных методов 19
1.2. Генератор псевдослучайных величин 21
1.2.1. Генератор псевдослучайных величин, построенный методом обратной функции (непрерывная величина). 21
1.2.2. Генератор псевдослучайных величин, построенный методом обратной функции (дискретная величина). 22
1.2.3. Генератор псевдослучайных величин, построенный универсальным методом. 23
1.2.4. Проверка качества случайных величин 24
1.3. Процедура искажения изображений 28
1.3.1 Преобразование Бокса – Мюллера. 28
1.4. Выводы 30
2. Реализация эмулятора нейронной сети Хемминга, решающей задачи распознавания зашумлённых образов. 31
2.1. Выбор структуры ИНС 33
2.2. Программная реализация ИНС 35
2.2.1. Интерфейс пользователя программы-эмулятора ИНС 39
2.3. Описание программного генератора случайных величин 41
2.3.1. Интерфейс пользователя программного генератора случайных величин 42
2.4. Выводы 45
3. Исследование результатов работы генератора псевдослучайной величины 46
3.1 Метод обратной функции для непрерывной случайной величины. 47
3.2 Метод обратной функции для дискретной случайной величины. 51
3.3 Генерация псевдослучайной величины универсальным методом 53
3.4 Выводы 57
4. Исследование результатов работы программы-эмулятора ИНС 59
4.1 Выводы 61
Заключение 62
Библиографический список 63
Приложение А. Генератор ПСВ. 65
Приложение B.Эмулятор НС Хемминга. 71
Проблема эффективного распознавания и анализа изображений является актуальной в настоящее время в сферах автоматизации процессов человеческой деятельности, связанных с идентификацией различных объектов окружающего мира, например, авторизация по отпечаткам пальцев, сетчатке глаза или другим биометрическим признакам, считывание текста, распознавание лиц, жестов, автомобильных номеров и многое другое. Данная проблема не потеряет своей актуальности и в будущем, так как высокий темп развития уровня компьютеризации в области получения графической информации требует создания различных методов их анализа и распознавания.
В настоящее время предложено большое количество нейросетевых моделей для решения задачи распознавания образов. Одним из главных преимуществ нейронных сетей (НС), свидетельствующим об их широких прикладных возможностях, является возможность параллельной обработки информации всеми нейронами. Благодаря этой способности при большом количестве межнейронных связей достигается значительное ускорение процесса обработки информации [1].
НС более устойчивы, чем другие статистические методы при распознавании изображений, если образы подвержены искажению. Отклик сети после обучения может быть до некоторой степени нечувствителен к небольшим изменениям входных сигналов. Эта внутренне присущая способность видеть образ сквозь шум и искажения важна для распознавания образов в реальном мире. Она позволяет преодолеть требование строгой точности, предъявляемое обычным компьютером. Важно отметить, что НС делает обобщения автоматически благодаря своей структуре, а не с помощью использования «человеческого интеллекта» в форме специально написанных компьютерных программ [2].
Уникальное свойство НС – универсальность. Хотя почти для всех вышеперечисленных задач существуют эффективные математические методы решения и, несмотря на то, что НС проигрывают специализированным методам для конкретных задач, благодаря универсальности и перспективности для решения глобальных задач, например, построения искусственного интеллекта и моделирования процесса мышления, они являются важным направлением исследования, требующим тщательного изучения.
Искусственные нейронные сети (НС) – набор математических и алгоритмических методов для решения широкого круга задач. Они превосходят последовательные машины в решении тех же задач, в которых машину превосходит человек. К задачам, успешно решаемым НС на данном этапе их развития, относятся [1]:
Актуальность исследований в направлении НС подтверждается большим количеством их различных применений.
Целью данной работы является создание программного обеспечения, реализующего построение генераторов псевдослучайных величин (ПСВ) с заданными законами распределения с возможностью исследования эффективности их работы и моделирование работы НС Хемминга, решающей задачи распознавания искаженных данных, шумы для которых формируются генераторами ПСВ.
Целью работы по построению генераторов псевдослучайной величины (ПСВ) и моделированию работы НС Хемминга с шумами в данных является разработка программного комплекса, позволяющего:
Для достижения поставленной цели в рамках данной работы, по построению генераторов ПСВ и моделированию работы НС Хемминга с шумами в данных являются:
-
построение эмулятора
Проблема эффективного распознавания образов имеет важное значение в сферах автоматизации определенных процессов человеческой деятельности, связанных с идентификацией различных объектов окружающего мира, например, авторизация рабочего персонала по отпечаткам пальцев или сетчатке глаза, идентификация продукта и расчет цены в магазине по штрих-коду и так далее.
Основные причины замены человеческого участия в задачах распознавания:
- Освобождение человека от однообразных операций для решения других более важных задач.
- Повышение качества и скорости принимаемых решений.
Актуальность
настоящей темы обусловлена, с одной
стороны, большим интересом к
системам распознавания образов
в современной науке, с другой
стороны, ее недостаточной
Различают три основных группы методов распознавания [3,4]:
1. Статистические
2.Структурные
3. Нейросетевые методы.
Далее будет рассмотрена каждая группа методов, определены недостатки и преимущества каждого метода, а также выбран один из методов для распознавания графических образов в данной работе.
1.1.1 Статистические методы
Сравнение объектов можно производить на основе их представления в виде векторов измерений. Допустим, что каждый объект представлен в точности d результатами измерений. У каждого объекта А i-я координата такого вектора признаков имеет один и тот же смысл. Например, первая координата может быть площадью объекта, вторая — моментом второго порядка по строке, третья координата — это протяженность объекта и так далее. Данные измерений удобно представлять в виде вещественных чисел. Сходство (близость) векторов признаков двух объектов может быть описано с помощью евклидова расстояния между векторами.
Статистический подход основывается на математических правилах классификации, которые формулируются и выводятся в терминах математической статистики. Этот метод обеспечивает получение классификатора в тех случаях, когда известны плотности распределения для всех совокупностей образов и вероятности появления образов для каждого класса.
В распознавании образов неизвестный объект для классификации представляется в виде вектора элементарных признаков. Система распознавания на основе векторов признаков может быть разработана различными способами — эти векторы могут быть известны системе в результате обучения или предсказаны на основе каких-либо моделей.
Система распознания на основе векторов признаков может быть разработана двумя различными способами – эти векторы могут быть известны системе в результате обучения или предсказаны на основе каких-либо моделей. Далее будут рассмотрены два альтернативных метода использования базы данных эталонных образцов, сформированных в результате обучения системы[3].
Алгоритм классификации заключается в группировке эталонных данных каждого класса с использованием вектора математического ожидания класса,
где j - эталонный вектор признаков для класса i. Неизвестный объект с вектором признаков х относится к классу i, если он существенно ближе к вектору математического ожидания класса i, чем к векторам математических ожиданий других классов. Вектор х можно отнести к классу выбросов, если он не лежит достаточно близко к одному из векторов математических ожиданий. Этот метод классификации прост и быстро работает, он подходит для задач, в которых точки каждого класса располагаются компактно и далеко от других классов.
Простой пример с двумя классами с двумерными векторами представлен на рисунке 1.
Рисунок 1. Два компактных класса.
При данной структуре классов коэффициент ошибок будет небольшим, если только структура эталонных образцов хорошо представляет структуру распознаваемых системой объектов. Трудности могут возникнуть, если классы эталонных образцов обладают сложной структурой или пересекаются[3].
Более гибкий, но одновременно более долгий метод классификации заключается в отнесении неизвестного вектора признаков х к тому классу, к отдельному эталонному образцу которого этот вектор наиболее близок. Это правило ближайшего соседа. Классификация по ближайшему соседу может быть эффективна, даже если классы имеют сложную структуру и когда классы перекрываются. При таком подходе не требуется предположений о моделях распределения векторов признаков в пространстве; алгоритм предполагает использование только известных эталонных образов. Метод основан на вычислении расстояния от x до всех образцов в базе данных и нахождении минимального расстояния. Преимущество такого подхода в том, что новые маркированные образцы можно в любой момент добавлять в базу данных. Существуют структуры данных, позволяющие сократить количество вычисляемых расстояний. Примерами таких структур являются древовидные и сеточные структуры данных, описанные в [3].