Кодирование

Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 23:42, доклад

Краткое описание

Кодирование – это технический приём, с помощью которого данные распределяются по категориям. Посредством кодирования сырые данные превращаются в символы – обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика.

Первый этап кодирования заключается в специфицировании категорий или классов, которым будут относиться ответы.

Содержимое работы - 1 файл

Кодирование.doc

— 46.00 Кб (Скачать файл)

Кодирование

  Кодирование – это технический приём, с  помощью которого данные распределяются по категориям. Посредством кодирования сырые данные превращаются в символы – обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика.

  Первый  этап кодирования заключается в  специфицировании категорий или  классов, которым будут относиться ответы. Число этих классов зависит от исследуемой проблемы и специальных позиций анкеты, используемых для генерирования информации. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически попадал в одну, и только одну категорию.

  Второй  этап кодирования касается назначения кодовых номеров классов. Например, мужской пол может обозначаться буквой М (male), а женский – буквой F (female), либо 1 или 2 соответственно. Для обозначения классов лучше использовать цифры, а не буквы. На этой стадии также лучше использовать цифры в том виде, как они зафиксировались в форме сбора данных, а не раскладывать их на более мелкие категории. Например, если имеются данные о фактическом возрасте людей, то не рекомендуется кодировать возраст как 1=до 20 лет, 2=20-29 лет и т.д. Это привело бы к ненужной потере исходной информации.

  Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказались готовыми для ввода в машину.

  Завершающий этап процесса кодирования состоит  в подготовке книги кодов, которая содержит общие инструкции, указывающие, каким образом была закодирована каждая позиция данных.

  Голубков  Е.П. Маркетинговые исследования: теория, методология и

  практика. Издание 2-е, М., Финпресс, 2000. 

Кодирование и кодировочная таблица в SPSS 

  Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными, используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.

  Переменные  — это ячейки памяти, в которые  можно записывать значения, введенные  с клавиатуры. Для переменной выбрано  имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы  слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.

  Переменные  могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".

  Подытожим задачи, которые решаются при составлении  кодировочной таблицы:

  • кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными;
  • кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.

  http://www.webresearch.lv/rus/spss/section_3/1

 

  В статистическом пакете SPSS предусмотрено 8 типов кодирования  переменных:

  • Numeric (Численный)  

  К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус и десятичный разделитель. Знак плюс перед числом, в отличие от минуса, не отображается. В текстовом поле Length (Длина) задается максимальное количество знаков, включая позицию для десятичного разделителя. В текстовом поле Decimals (Десятичные разряды) вводится количество отображаемых знаков дробной части.  

  • Comma (Запятая)   

  К допустимым значениям относятся  цифры, перед которыми стоит знак плюс или минус, точка, как десятичный разделитель и одна или несколько запятых в качестве разделителей групп разрядов. Если запятые опускаются при вводе, они вставляются автоматически. Длина такой переменной равна максимальному количеству знаков, включая десятичный разделитель и запятые между группами разрядов.  

  • Dot (Точка)  

  К допустимым значениям относятся  цифры, перед которыми стоит знак плюс или минус, запятая, как десятичный разделитель и одна или несколько  точек в качестве разделителей групп  разрядов. Если точки опускаются при  вводе, они вставляются автоматически.  

  • Scientific notation (Экспоненциальное  представление)  

  При вводе данных разрешаются все  допустимые численные значения, включая  экспоненциальное представление, о  котором свидетельствует содержащаяся в числе буква Е или D, а также знак плюс или минус.  

  • Date (Дата)  

  Допустимые  значения — дата и/или время.  

  • Dollar (Доллар)  

  К допустимым значениям относятся: знак доллара, точка, как десятичный разделитель  и запятые, как разделители групп  разрядов. Если знак доллара или  запятые опускаются при вводе, они вставляются автоматически.  

  • Special currency (Специальная валюта)  

  Пользователь  может задавать собственные форматы  валюты. В поле Length в этом случае задается максимальное количество знаков, включая все знаки, заданные пользователем. Обозначение валюты при вводе не указывается; оно вставляется автоматически.  

  • String (Строка)  

  Строка  символов. К допустимым значениям  относятся: буквы, цифры и специальные  символы. Различаются короткие и  длинные строковые переменные. Короткие строковые переменные могут содержать не более восьми знаков. В большинстве процедур SPSS применение длинных строковых переменных ограничивается или вообще не допускается.

  http://www.learnspss.ru/hndbook/glava3/cont6.htm 

  Строчные  переменные используются достаточно редко, например, для введения ответов на открытые вопросы или фамилий  респондентов, если имеется такая  возможность и в них есть необходимость, например переменная dj56.1.1 8-й волны RLMS содержит ответы на вопрос "В чем состояла эта Ваша работа?"

  Обычно  при внесении в компьютер информации для статистической обработки ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически  любая обрабатывающая программа  может использовать эти цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз. Различные методы анализа данных ориентированы на данные определенного типа. Для получения интерпретируемых результатов перед применением программы исследователь должен определить тип обрабатываемых соответствующим методом переменных.

  http://www.studfiles.ru/dir/cat26/subj87/file13483/view136455.html 

  При вводе и выводе данных надо учитывать  следующие особенности:  

  • Численные форматы: В численных форматах десятичным разделителем может быть либо точка, либо запятая. Тип десятичного разделителя зависит от настроек диалогового окна Язык и стандарты (Regional Settings) на панели управления Windows. Точное значение переменной хранится внутри программы, а Редактор данных отображает на экране лишь заданное число десятичных разрядов. Значения, которые имеют больше десятичных разрядов, округляются. Для вычислений применяется точное значение.
 
  • Строковые форматы: В длинных строковых  переменных значения дополняются пробелами до максимальной длины. Например, в строковой переменной длины 10 значение "SPSS" хранится внутри программы как "SPSS" плюс 6 пробелов.
 
  • Форматы даты и времени: В форматах даты в качестве разделителей между значениями дня, месяца и числа могут применяться косая черта, дефис, пробел, запятая или точка. Можно выбрать один из нескольких форматов даты (dd-mm-yyyy, dd-mmm-yy, mm/dd/yyyy и т.д.). Дата в формате dd-mmm-yy отображается с разделителем-дефисом и сокращением названия месяца из трех букв. Дата в форматах dd/mm/yy и mm/dd/yy отображается с разделителем-косой чертой и номером месяца вместо названия.
 
  • Всего доступно 27 различных форматов даты и времени, которые отображаются в разворачивающемся  списке. В форматах времени в качестве разделителей между значениями часов, минут и секунд могут использоваться двоеточие, точка или пробел.
 
  • Специальная валюта: Форматы отображения валюты ССА, ССВ, ССС, CCD и ССЕ задаются с  помощью вкладки Currency (Валюта), которая  открывается командой меню Edit (Правка) Options... (Параметры...) Остановимся на строчных (STRING) и числовых (NUMERIC) переменных.
 

  http://www.learnspss.ru/hndbook/glava3/cont6.htm

Информация о работе Кодирование