Кодирование
Автор работы: Пользователь скрыл имя, 10 Декабря 2011 в 23:42, доклад
Краткое описание
Кодирование – это технический приём, с помощью которого данные распределяются по категориям. Посредством кодирования сырые данные превращаются в символы – обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика.
Первый этап кодирования заключается в специфицировании категорий или классов, которым будут относиться ответы.
Содержимое работы - 1 файл
Кодирование.doc
— 46.00 Кб (Скачать файл)Кодирование
Кодирование – это технический приём, с помощью которого данные распределяются по категориям. Посредством кодирования сырые данные превращаются в символы – обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика.
Первый этап кодирования заключается в специфицировании категорий или классов, которым будут относиться ответы. Число этих классов зависит от исследуемой проблемы и специальных позиций анкеты, используемых для генерирования информации. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически попадал в одну, и только одну категорию.
Второй этап кодирования касается назначения кодовых номеров классов. Например, мужской пол может обозначаться буквой М (male), а женский – буквой F (female), либо 1 или 2 соответственно. Для обозначения классов лучше использовать цифры, а не буквы. На этой стадии также лучше использовать цифры в том виде, как они зафиксировались в форме сбора данных, а не раскладывать их на более мелкие категории. Например, если имеются данные о фактическом возрасте людей, то не рекомендуется кодировать возраст как 1=до 20 лет, 2=20-29 лет и т.д. Это привело бы к ненужной потере исходной информации.
Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказались готовыми для ввода в машину.
Завершающий этап процесса кодирования состоит в подготовке книги кодов, которая содержит общие инструкции, указывающие, каким образом была закодирована каждая позиция данных.
Голубков Е.П. Маркетинговые исследования: теория, методология и
практика.
Издание 2-е, М., Финпресс, 2000.
Кодирование
и кодировочная таблица
в SPSS
Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными, используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.
Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Для переменной выбрано имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.
Переменные
могут принимать различные
Подытожим задачи, которые решаются при составлении кодировочной таблицы:
- кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными;
- кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.
http://www.webresearch.lv/
В статистическом пакете SPSS предусмотрено 8 типов кодирования переменных:
- Numeric (Численный)
К
допустимым значениям относятся цифры,
перед которыми стоит знак плюс или минус
и десятичный разделитель. Знак плюс перед
числом, в отличие от минуса, не отображается.
В текстовом поле Length (Длина) задается
максимальное количество знаков, включая
позицию для десятичного разделителя.
В текстовом поле Decimals (Десятичные разряды)
вводится количество отображаемых знаков
дробной части.
- Comma (Запятая)
К
допустимым значениям относятся
цифры, перед которыми стоит знак
плюс или минус, точка, как десятичный
разделитель и одна или несколько
запятых в качестве разделителей групп
разрядов. Если запятые опускаются при
вводе, они вставляются автоматически.
Длина такой переменной равна максимальному
количеству знаков, включая десятичный
разделитель и запятые между группами
разрядов.
- Dot (Точка)
К
допустимым значениям относятся
цифры, перед которыми стоит знак
плюс или минус, запятая, как десятичный
разделитель и одна или несколько
точек в качестве разделителей групп
разрядов. Если точки опускаются при
вводе, они вставляются автоматически.
- Scientific notation (Экспоненциальное представление)
При
вводе данных разрешаются все
допустимые численные значения, включая
экспоненциальное представление, о
котором свидетельствует
- Date (Дата)
Допустимые
значения — дата и/или время.
- Dollar (Доллар)
К
допустимым значениям относятся: знак
доллара, точка, как десятичный разделитель
и запятые, как разделители групп
разрядов. Если знак доллара или
запятые опускаются при вводе, они вставляются
автоматически.
- Special currency (Специальная валюта)
Пользователь
может задавать собственные форматы
валюты. В поле Length в этом случае
задается максимальное количество знаков,
включая все знаки, заданные пользователем.
Обозначение валюты при вводе не указывается;
оно вставляется автоматически.
- String (Строка)
Строка символов. К допустимым значениям относятся: буквы, цифры и специальные символы. Различаются короткие и длинные строковые переменные. Короткие строковые переменные могут содержать не более восьми знаков. В большинстве процедур SPSS применение длинных строковых переменных ограничивается или вообще не допускается.
http://www.learnspss.ru/
Строчные переменные используются достаточно редко, например, для введения ответов на открытые вопросы или фамилий респондентов, если имеется такая возможность и в них есть необходимость, например переменная dj56.1.1 8-й волны RLMS содержит ответы на вопрос "В чем состояла эта Ваша работа?"
Обычно при внесении в компьютер информации для статистической обработки ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически любая обрабатывающая программа может использовать эти цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз. Различные методы анализа данных ориентированы на данные определенного типа. Для получения интерпретируемых результатов перед применением программы исследователь должен определить тип обрабатываемых соответствующим методом переменных.
http://www.studfiles.ru/dir/
При
вводе и выводе
данных надо учитывать
следующие особенности:
- Численные форматы: В численных форматах десятичным разделителем может быть либо точка, либо запятая. Тип десятичного разделителя зависит от настроек диалогового окна Язык и стандарты (Regional Settings) на панели управления Windows. Точное значение переменной хранится внутри программы, а Редактор данных отображает на экране лишь заданное число десятичных разрядов. Значения, которые имеют больше десятичных разрядов, округляются. Для вычислений применяется точное значение.
- Строковые форматы: В длинных строковых переменных значения дополняются пробелами до максимальной длины. Например, в строковой переменной длины 10 значение "SPSS" хранится внутри программы как "SPSS" плюс 6 пробелов.
- Форматы даты и времени: В форматах даты в качестве разделителей между значениями дня, месяца и числа могут применяться косая черта, дефис, пробел, запятая или точка. Можно выбрать один из нескольких форматов даты (dd-mm-yyyy, dd-mmm-yy, mm/dd/yyyy и т.д.). Дата в формате dd-mmm-yy отображается с разделителем-дефисом и сокращением названия месяца из трех букв. Дата в форматах dd/mm/yy и mm/dd/yy отображается с разделителем-косой чертой и номером месяца вместо названия.
- Всего доступно 27 различных форматов даты и времени, которые отображаются в разворачивающемся списке. В форматах времени в качестве разделителей между значениями часов, минут и секунд могут использоваться двоеточие, точка или пробел.
- Специальная валюта: Форматы отображения валюты ССА, ССВ, ССС, CCD и ССЕ задаются с помощью вкладки Currency (Валюта), которая открывается командой меню Edit (Правка) Options... (Параметры...) Остановимся на строчных (STRING) и числовых (NUMERIC) переменных.
http://www.learnspss.ru/