Автор работы: Пользователь скрыл имя, 01 Декабря 2011 в 09:06, контрольная работа
Задание 1. Исследование структуры совокупности.
Задание 2. Выявление наличия корреляционной связи между признаками, установление направления связи, измерение тесноты и силы связи, а также оценка статистической значимости показателя силы связи.
Задание 3. Применение метода выборочных наблюдений.
Расчет общей дисперсии по формуле (10):
Общая дисперсия может быть также рассчитана по формуле
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
Тогда
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 10 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 10
Вспомогательная
таблица для расчета
Группы
домохозяйств по объему валового дохода,
тыс. руб.
х |
Число домохозяйств, fj | Среднее значение |
||
1 | 2 | 3 | 4 | 5 |
28-40 | 3 | 16,00 | -9,00 | 243,00 |
40-52 | 5 | 21,00 | -4,00 | 80,00 |
52-64 | 12 | 25,00 | 0,00 | 0,00 |
64-76 | 6 | 27,50 | 2,50 | 37,50 |
76-88 | 4 | 33,00 | 8,00 | 256,00 |
Итого | 30 | 122,50 | 616,50 |
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
Вывод. 81,94% вариации суммы расходов на продукты питания домохозяйств обусловлено вариацией валового дохода, а 18,06% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чеддока (табл. 11):
Таблица 11
Шкала Чеддока
h | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика
силы связи |
Слабая | Умеренная | Заметная | Тесная | Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
Вывод. Согласно шкале Чеддока связь между валовым доходом и расходами на продукты питания по домашним хозяйствам населения региона за год является весьма тесной.
3.
Оценка статистической
значимости коэффициента
детерминации
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если Fрасч>Fтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент
таблицы Фишера критических величин
F-критерия для значений
=0,05; k1=3,4,5; k2=24-35 представлен
ниже:
k2 | ||||||||||||
k1 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 |
3 | 3,01 | 2,99 | 2,98 | 2,96 | 2,95 | 2,93 | 2,92 | 2,91 | 2,90 | 2,89 | 2,88 | 2,87 |
4 | 2,78 | 2,76 | 2,74 | 2,73 | 2,71 | 2,70 | 2,69 | 2,68 | 2,67 | 2,66 | 2,65 | 2,64 |
5 | 2,62 | 2,60 | 2,59 | 2,57 | 2,56 | 2,55 | 2,53 | 2,52 | 2,51 | 2,50 | 2,49 | 2,48 |
Расчет дисперсионного F-критерия Фишера для оценки =81,94%, полученной при =25,0807, =20,5500:
Fрасч
Табличное значение F-критерия при = 0,05:
n | m | k1=m-1 | k2=n-m | Fтабл ( ,5, 25) |
30 | 5 | 4 | 25 | 2,76 |
Вывод: поскольку Fрасч>Fтабл, то величина коэффициента детерминации =81,94% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Валовой доход и расходы на продукты питания правомерны не только для выборки, но и для всей генеральной совокупности домохозяйств.
Задание 3
По результатам выполнения Задания 1 с вероятностью 0,954 необходимо определить:
Выполнение Задания 3
Целью выполнения данного Задания является определение для генеральной совокупности домохозяйств границ, в которых будут находиться величина среднего валового дохода на одного члена домохозяйства в год и доля домохозяйств с уровнем валового дохода менее 52 тыс. руб.
1. Определение ошибки выборки для среднего валового дохода на одного члена домохозяйства в год и границ, в которых будет находиться генеральная средняя
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности).