Автор работы: Пользователь скрыл имя, 24 Октября 2011 в 09:54, доклад
Классификация – это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. Классификация фиксирует закономерные связи между классами объектов.
Объект классификации – элемент множества, используемый при классификации.
Признак классификации – признак, по которому производится деление заданного множества на подмножества.
ЗНАЧЕНИЕ РЕКВИЗИТОВ
В результате классификации мы имеем списки групп. Например, по специальности прикладная информатика или на 3 курсе, или бюджетные. Состав фасетной формулы: специальность, курс, способ финансирования. Каждая группа характеризуется одним из значений в фасете. Так группа 735: прикладная информатика, 3 курс, смешанная.
К преимуществам данной системы следует отнести большую емкость системы и высокую степень гибкости, поскольку при необходимости можно вводить дополнительные фасеты и изменять их место в формуле. При изменении характера задач или характеристик объектов классификации разрабатываются новые фасеты или дополняются новыми признаками уже существующие фасеты без коренной перестройки структуры всего классификатора.
Недостатками фасетного метода классификации являются неполное использование емкости, не традиционность и иногда сложность применения.
В современных
классификационных схемах часто
одновременно используются оба метода
классификации. Это снижает влияние
недостатков методов
1.2. Методы кодирования
Для полной формализации информации недостаточно простой классификации, поэтому проводят следующую процедуру — кодирование.
Кодирование — это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Кодирование реализует перевод информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов.
Система кодирования — это совокупность правил обозначения объектов и группировок с использованием кодов.
Код — это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода.
Код характеризуется следующими параметрами:
К методам
кодирования предъявляются
Методы кодирования могут носить самостоятельный характер – регистрационные методы кодирования, или быть основанными на предварительной классификации объектов – классификационные методы кодирования.
Регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый.
Порядковый метод — каждый из объектов множества кодируется с помощью чисел натурального ряда.. В этом случае каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера. Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. этот метод кодирования не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, так как резервные коды располагаются в конце ряда. По этим причинам порядковый метод отдельно редко применяется при создании классификаторов. Чаще всего он применяется в сочетании с другими методами кодирования.
Пример. Числа месяца, годы. Если присвоить коды районам Н.Новгорода при их классификации по алфавиту
Наименование | Код |
Автозаводский | 1 |
Канавинский | 2 |
Ленинский | 3 |
Московский | 4 |
Нижегородский | 5 |
Приокский | 6 |
Советский | 7 |
Сормовский | 8 |
Описание классификатора:
Название классификатора | районы Н.Новгорода. |
Метод классификации | элементарный, по алфавиту |
Метод кодирования | Порядковый |
Длина кода | 1 |
Структура кода |
Х
район Н.Новгорода |
Обеспечивает простоту добавления новых объектов и краткость кода, однако такой код не несёт никакой информации об объекте. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. Для повышения устойчивости классификатора иногда прибегают к пропуску номеров.
Серийно-порядковый метод — кодами служат числа натурального ряда с закрепленной отдельной серией этих чисел (интервалов натурального ряда) за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва.
Пример. Рассмотрим международный классификатор видов транспорта и транспортировки товаров.
Наименование | Код |
Водный
транспорт
морское судно железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме) дорожное средство, расположенное на морском судне (суда типа Ро-Ро) речные суда суда смешанного "река-море» плавания Железнодорожный транспорт железнодорожный вагон, платформа, цистерна дорожное транспортное средство, расположенное на железнодорожной платформе (в вагоне) Автомобильный транспорт транспортное средство состав транспортных средств (тягач с полуприцепом и (или) прицепом) иные дорожные транспортные средства Воздушный транспорт воздушное судно дорожное транспортное средство, расположенное на воздушном судне Стационарный транспорт трубопроводный транспорт линии электропередачи иные виды стационарного транспорта Иные виды транспортировки товара почтовые отправления экспресс-доставка иные виды транспортировки |
10 12 16 80 81 20 23 30 31 39 40 43 70 71 79 50 55 59 |
Посмотрите, выделены серии номеров по видам транспорта.
10 - 19 – морской транспорт.
20 – 29 – железнодорожный транспорт.
30 – 39 – автодорожный транспорт.
40 – 49 – воздушный транспорт.
50 - 59 - почтовые
отправления (активный вид
60 - 69 – смешанные перевозки (активный вид транспорта неизвестен).
70 - 79 –
фиксированные транспортные
80 - 89 –
внутренний водный транспорт.
Этот код используется только
в тех случаях, когда этот
вид водного транспорта
90 - 99 – вид транспорта неизвестен.
Кодовые обозначения подвидам транспорта присваиваются внутри серии. Оформим таблицу в соответствии с правилами.
Наименование | Код |
Водный
транспорт
Морской транспорт морское судно железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме) дорожное
средство, расположенное на морском
судне (суда типа Ро-Ро) Внутренний
водный транспорт речные суда суда
смешанного "река-море» плавания Железнодорожный транспорт железнодорожный вагон, платформа, цистерна дорожное транспортное средство, расположенное на железнодорожной платформе (в вагоне) Автомобильный
транспорт транспортное средство состав транспортных средств (тягач с полуприцепом и (или) прицепом) иные
дорожные транспортные средства Воздушный
транспорт воздушное судно дорожное транспортное средство, расположенное на воздушном
судне Почтовые отправления почтовые отправления (обычные) экспресс-доставка иные
виды транспортировки Стационарный транспорт трубопроводный транспорт линии электропередачи иные виды стационарного транспорта |
Серия
10-19
10 12 16 Свободные № 11, 13-15, 17-19 Серия 80-89 80 81 Свободные № 82-89 Серия 20-29 20 23 Свободные № 21, 22, 24-29 Серия 30-39 30 31 39 Свободные № 32-38 Серия 40-49 40 43 Свободные № 41, 42, 44-49 Серия 50-59 50 55 59 Свободные № 51-54, 56-59 Серия 70-79 70 71 79 Свободные № 72-78 |
При построении классификатора использован прием пропуска номеров внутри серии. Например, 41 и 42.
Описание классификатора:
Название классификатора | Группы студентов |
Метод классификации | Иерархический |
Метод кодирования | Серийно-порядковый |
Длина кода | 2 |
Структура кода |
ХХ
Вид транспортировки
|
Иногда получается успешное решение проблем за счет встречного кодирования в смежных сериях. Рассмотрим применение такого подхода на примере группы водный транспорт.
Наименование | Код |
Водный
транспорт Морской
транспорт морское судно железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме) дорожное
средство, расположенное на морском
судне (суда типа Ро-Ро) Внутренний
водный транспорт речные суда суда смешанного "река-море» плавания |
Серия
10-19
Серия 10-15 11 12 13 Свободные № 10, 14-15 Серия 16-19 19 18 Свободные № 17,18 |