Автор работы: Пользователь скрыл имя, 24 Декабря 2010 в 01:25, лабораторная работа
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования деятельности 30-ти предприятий и частично использует результаты ЛР-1.
В ЛР-2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные ЛР-1 после исключения из них аномальных наблюдений.
Режим работы инструмента Регрессия использует по умолчанию уровень надежности Р=0,95. Для этого уровня надежности уровень значимости равен α = 1 – 0,95 = 0,05. Этот уровень значимости считается заданным.
В инструменте Регрессия надстройки Пакет анализа для каждого из коэффициентов а0 и а1 вычисляется уровень его значимости αр, который указан в результативной таблице (табл.2.7 термин "Р-значение"). Если рассчитанный для коэффициентов а0, а1 уровень значимости αр, меньше заданного уровня значимости α= 0,05, то этот коэффициент признается неслучайным (т.е. типичным для генеральной совокупности), в противном случае – случайным.
Примечание. В случае, если признается случайным свободный член а0, то уравнение регрессии целесообразно построить заново без свободного члена а0. В этом случае в диалоговом окне Регрессия необходимо задать те же самые параметры за исключением лишь того, что следует активизировать флажок Константа-ноль (это означает, что модель будет строиться при условии а0=0). В лабораторной работе такой шаг не предусмотрен.
Если незначимым (случайным) является коэффициент регрессии а1, то взаимосвязь между признаками X и Y в принципе не может аппроксимироваться линейной моделью.
Вывод:
Для свободного члена а0 уравнения регрессии рассчитанный уровень значимости есть αр =0,36. Так как он больше заданного уровня значимости α=0,05, то коэффициент а0 признается случайным.
Для коэффициента регрессии а1 рассчитанный уровень значимости есть αр = 0,001 Так как он меньше заданного уровня значимости α=0,05, то коэффициент а1 признается типичным.
5.1.2. Зависимость доверительных интервалов коэффициентов уравнения от заданного уровня надежности
Доверительные интервалы коэффициентов а0, а1 построенного уравнения регрессии при уровнях надежности Р=0,95 и Р=0,683 представлены в табл.2.7, на основе которой формируется табл.2.9.
Таблица 2.9
Границы доверительных интервалов коэффициентов уравнения
Коэффициенты | Границы доверительных интервалов | |||
Для уровня надежности Р=0,95 | Для уровня надежности Р=0,683 | |||
нижняя | верхняя | нижняя | верхняя | |
а0 | -36,05 | 13,68 | -23,55 | 1,18 |
а1 | 0,90 | 1,27 | 0,99 | 1,18 |
Вывод:
В генеральной совокупности предприятий значение коэффициента а0 следует ожидать с надежностью Р=0,95 в пределах -36,05 а0 13,68, значение коэффициента а1 в пределах 0,90 а1 1,27. Уменьшение уровня надежности ведет к сужению доверительных интервалов коэффициентов уравнения.
Практическую пригодность построенной модели можно охарактеризовать по величине линейного коэффициента корреляции r:
Пригодность
построенной регрессионной
В основе такой оценки лежит равенство R = r (имеющее место для линейных моделей связи), а также шкала Чэддока, устанавливающая качественную характеристику тесноты связи в зависимости от величины r.
Согласно шкале Чэддока высокая степень тесноты связи признаков достигается лишь при >0,7, т.е. при >0,7. Для индекса детерминации R2 это означает выполнение неравенства R2 >0,5.
При недостаточно тесной связи признаков X, Y (слабой, умеренной, заметной) имеет место неравенство 0,7, а следовательно, и неравенство .
С учетом вышесказанного, практическая пригодность построенной модели связи оценивается по величине R2 следующим образом:
Значение индекса детерминации R2 приводится в табл.2.5 в ячейке В79 (термин "R - квадрат").
Вывод:
Значение линейного коэффициента корреляции r и значение индекса детерминации R2 согласно табл. 2.5 равны: r = 0,91, R2 =0,83. Поскольку и , то построенная линейная регрессионная модель связи пригодна для практического использования.
- 5.3. Общая оценка адекватности регрессионной модели по F-критерию Фишера
Адекватность построенной регрессионной
модели фактическим данным (xi, yi) устанавливается по критерию Р.Фишера, оценивающему статистическую значимость (неслучайность) индекса детерминации R2. Рассчитанная для уравнения регрессии оценка значимости R2 приведена в табл.2.6 в ячейке F86 (термин "Значимость F"). Если она меньше заданного уровня значимости α=0,05, то величина R2 признается неслучайной и, следовательно, построенное уравнение регрессии может быть использовано как модель связи между признаками Х и Y для генеральной совокупности предприятий отрасли.
Вывод:
Рассчитанный уровень значимости αр индекса детерминации R2 есть αр=0,00001.Так как он меньше заданного уровня значимости α=0,05, то значение R2 признается типичным и модель связи между признаками Х и Y -11,18+1,08х применима для генеральной совокупности предприятий отрасли в целом.
- 5.4. Оценка погрешности регрессионной модели
Погрешность регрессионной модели можно оценить по величине стандартной ошибки построенного линейного уравнения регрессии . Величина ошибки оценивается как среднее квадратическое отклонение по совокупности отклонений исходных (фактических) значений yi признака Y от его теоретических значений , рассчитанных по построенной модели.
Погрешность регрессионной модели выражается в процентах и рассчитывается как величина .100.
В адекватных моделях погрешность не должна превышать 12%-15%.
Значение приводится в выходной таблице "Регрессионная статистика" (табл.2.5) в ячейке В81 (термин "Стандартная ошибка"), значение – в таблице описательных статистик (ЛР-1, Лист 1, табл.3,ячейка В48).
Вывод:
Погрешность линейной регрессионной модели составляет
.100=(11,967074/6080)*100=1, что подтверждает адекватность построенной модели - 11,18+1,08х.
Задача 6. Дать экономическую интерпретацию:
1) коэффициента регрессии а1;
3) остаточных величин i.
2) коэффициента эластичности КЭ;
6.1. Экономическая интерпретация коэффициента регрессии а1
В случае линейного уравнения регрессии =a0+a1x величина коэффициента регрессии a1 показывает, на сколько в среднем (в абсолютном выражении) изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения. Знак при a1 показывает направление этого изменения.
Вывод:
Коэффициент регрессии а1 =1,08. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1 млн руб. значение результативного признака Выпуск продукции увеличивается (уменьшается) в среднем на 1,08 млн руб.
6.2. Экономическая интерпретация коэффициента эластичности.
С целью расширения возможностей экономического анализа явления используется коэффициент эластичности , который измеряется в процентах и показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%.
Средние значения и приведены в таблице описательных статистик (ЛР-1, Лист 1, табл.3).
Расчет коэффициента эластичности:
=1,08*(6080/5673,85)=1,15%
Вывод:
Значение коэффициента эластичности Кэ=1,15 показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1% значение результативного признака Выпуск продукции увеличивается в среднем на 1,15%.
6.3. Экономическая интерпретация остаточных величин εi
Каждый их остатков характеризует отклонение фактического значения yi от теоретического значения , рассчитанного по построенной регрессионной модели и определяющего, какого среднего значения следует ожидать, когда фактор Х принимает значение xi.
Анализируя остатки, можно сделать ряд практических выводов, касающихся выпуска продукции на рассматриваемых предприятиях отрасли.
Значения остатков i (таблица остатков из диапазона А98:С128) имеют как положительные, так и отрицательные отклонения от ожидаемого в среднем объема выпуска продукции (которые в итоге уравновешиваются, т.е. ).
Экономический интерес представляют наибольшие расхождения между фактическим объемом выпускаемой продукции yi и ожидаемым усредненным объемом .
Вывод:
Согласно таблице остатков максимальное превышение ожидаемого среднего объема выпускаемой продукции имеют три предприятия - с номерами 6, 27, 20, а максимальные отрицательные отклонения - три предприятия с номерами 8, 24, 26 . Именно эти шесть предприятий подлежат дальнейшему экономическому анализу для выяснения причин наибольших отклонений объема выпускаемой ими продукции от ожидаемого среднего объема и выявления резервов роста производства.
Задача 7. Нахождение наиболее адекватного нелинейного уравнения регрессии с помощью средств инструмента Мастер диаграмм.
Уравнения регрессии и их графики построены для 3-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.
Уравнения регрессии и соответствующие им индексы детерминации R2 приведены в табл.2.10 (при заполнении данной таблицы коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел).
Таблица 2.10
Регрессионные модели связи
Вид уравнения Уравнение регрессии Индекс детерминации R2
Полином 2-го порядка 3Е-05х2+0,6702х+271,71 0,8353 Полином 3-го порядка 4Е-08х3-0,0007х2+5,0549х-8150, 3 0,8381 Степенная функция 0,1939х1,1795 0,8371 Выбор наиболее адекватного уравнения регрессии определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 =0,8381. Следовательно, наиболее адекватное исходным данным нелинейное уравнение регрессии имеет вид 4Е-08х3-0,0007х2+5,0549х-8150,
3.
ПРИЛОЖЕНИЕ
таблица 2.1 исходные данные Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб. 5 80,00 70,00 23 87,00 93,00 27 95,00 80,00 1 98,00 103,00 8 102,00 110,00 32 104,00 116,00 22 112,00 99,00 19 115,00 95,00 2 117,00 113,00 3 121,00 126,00 13 122,00 134,00 26 125,00 123,00 9 127,00 129,00 4 128,00 140,00 28 131,00 125,00 17 132,00 128,00 6 135,00 120,00 14 135,00 146,00 25 135,00 130,00 7 139,00 162,00 30 145,00 130,00 18 147,00 152,00 10 148,00 161,00 20 149,00 130,00 24 152,00 149,00 29 153,00 137,00 15 156,00 177,00 11 163,00 170,00 21 167,00 175,00 16 180,00 190,00
таблица 2.2Зависимость выпуска продукции от среднегодовой стоимости основных фондов Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Выпуск продукции Всего В среднем
на одно
предприятие1 3905-4775 4 346,00 86,50 2 4775-5645 5 533,00 106,60 3 5645-6515 11 1463,00 133,00 4 6515-7385 7 1036,00 148,00 5 7385-8255 3 535,00 178,33 Итого 30 3913,00 130,43 таблица 2.3 Показатели внутригрупповой вариации Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Внутригрупповая дисперсия 1 3905-4775 4 157,25 2 4775-5645 5 127,25 3 5645-6515 11 186,19 4 6515-7385 7 42,50 5 7385-8255 3 70,50 Итого 30 Таблица 2.4 Показатели дисперсии и эмпирического корреляционного отношения Общая дисперсия Средняя из внутригрупповых дисперсия Межгрупповая дисперсия Эмпирическое корреляционное отношение 804,7788889 127,4104167 677,3684722 0,917432671 Выходные таблицы ВЫВОД ИТОГОВ Таблица 2.5 Регрессионная статистика Множественный R 0,91318826 R-квадрат 0,833912798 Нормированный R-квадрат 0,827981112 Стандартная ошибка 11,96707419 Наблюдения 30 Дисперсионный анализ Таблица 2.6. df SS MS F Значимость F Регрессия 1 20133,46245 20133,46245 140,5861384 1,97601E-12 Остаток 28 4009,904212 143,2108647 Итого 29 24143,36667 Таблица 2.7
Коэффициенты Стандартная ошибка t-статистика P-Значение Y-пересечение -11,18284019 12,14197063 -0,92100702 0,364914527 Переменная X 1 1,089355181 0,09187519 11,85690257 1,97601E-12 Нижние 95% Верхние 95% Нижние 68,3% Верхние 68,3% -36,05453922 13,68885884 -23,55361756 1,187937182 0,901157387 1,277552975 0,995748668 1,182961694
Таблица 2.8 ВЫВОД ОСТАТКА Наблюдение Предсказанное Y Остатки 1 75,96557429 -5,965574286 2 83,59106055 9,408939448 3 92,305902 -12,305902 4 95,57396754 7,426032457 5 99,93138827 10,06861173 6 102,1100986 13,88990137 7 110,8249401 -11,82494008 8 114,0930056 -19,09300562 9 116,271716 -3,271715981 10 120,6291367 5,370863295 11 121,7184919 12,28150811 12 124,9865574 -1,986557429 13 127,1652678 1,83473221 14 128,254623 11,74537703 15 131,5226885 -6,522688514 16 132,6120437 -4,612043695 17 135,8801092 -15,88010924 18 135,8801092 10,11989076 19 135,8801092 -5,880109238 20 140,23753 21,76247004 21 146,773661 -16,77366105 22 148,9523714 3,047628591 23 150,0417266 10,95827341 24 151,1310818 -21,13108177 25 154,3991473 -5,399147314 26 155,4885025 -18,4885025 27 158,756568 18,24343196 28 166,3820543 3,617945695 29 170,739475 4,260524972 30 184,9010924 5,098907619
Рис.2.1. Уравнения регрессии и их графики.
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-
ЭКОНОМИЧЕСКИЙ ИНСТИТУТ КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения компьютерной лабораторной работы
Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel
Вариант №85
Выполнил: ст. III курса вечерняя группа, специальности Финансы и Кредит Хоромина Ю.В.
Проверил: Новокупова И. Н.
Владимир 2010 г.
I. Постановка задачи
В процессе статистического изучения деятельности одного из предприятий получены данные о годовом выпуске продукции (в стоимостном выражении) за шестилетний период, а также данные о выпуске продукции по месяцам за 6-ой год.
Полученные два ряда динамики представлены в формате электронных таблиц процессора Excel, годовые данные - в диапазоне ячеек A6:B12, а данные за 6-ой год по месяцам - в диапазоне D6:E19.
Исходные данные Годы Выпуск продукции, млн. руб. Месяцы Выпуск продукции, млн. руб. 1 15770 январь 1450 2 16010 февраль 1516 3 16400 март 1575 4 16280 апрель 1545 5 16515 май 1605 6 19377 июнь 1585 июль 1641 август 1616 сентябрь 1695 октябрь 1716 ноябрь 1728 декабрь 1705 Итого 19377
Задание 1.
Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.
Выполнение Задания 1 заключается в решении двух задач:
Задача 1. Расчет цепных и базисных показателей динамики: абсолютный прирост (сокращение); темп роста (снижения); темп прироста (сокращения) и абсолютное значение 1 % прироста.
Задача 2. Расчет средних показателей ряда динамики: средний уровень ряда динамики; средний абсолютный прирост; средний темп роста и средний темп прироста.
Полученные результаты представлены в таблицах:
Показатели динамики выпуска продукции
Показатели динамики выпуска продукции Годы Выпуск продукции, млн. руб. Абсолютный прирост,
млн. руб.Темп роста,
%Темп прироста,
%Абсолютное
значение
1% приростацепной базисный цепной базисный цепной базисный 1-й 15770,00 2-й 16010,00 240,00 240,00 101,5 101,5 1,5 1,5 157,7 3-й 16400,00 390,00 630,00 102,4 104,0 2,4 4,0 160,1 4-й 16280,00 -120,00 510,00 99,3 103,2 -0,7 3,2 164 5-й 16515,00 235,00 745,00 101,4 104,7 1,4 4,7 162,8 6-й 19377,00 2 862,00 3 607,00 117,3 122,9 17,3 22,9 165,15
Средние показатели ряда динамики
Средний уровень ряда динамики,млн. руб., 16725,33 Средний абсолютный прирост,млн. руб., 721,40 Средний темп роста, %, 104,2 Средний темп прироста, %, 4,2
Задание 2.
Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции.
Выполнение Задания 2 заключается в решении двух задач:
Задача 1. Прогнозирование выпуска продукции предприятием на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста.
Прогноз выпуска продукции на 7-ой год
По среднему абсолютному приросту,млн.руб., 20098,40
По среднему темпу роста, %, 20190,83
Задача 2. Прогнозирование выпуска продукции предприятием на год вперёд с использованием аналитического выравнивания ряда динамики по прямой, параболе и полиному 3-го порядка.
Задание 3.
Выявление тенденции развития изучаемого явления (тренда) по данным о выпуске продукции по месяцам за 6-ой год методами скользящей средней и аналитического выравнивания.
Выполнение Задания 3 заключается в решении двух задач:
Задача 1. Расчет скользящей средней, полученной на основе трёхчленной скользящей суммы.
Выпуск продукции за 6-ой год Месяцы Выпуск продукции, млн. руб. Скользящее
среднееянварь 1450,00 февраль 1516,00 1513,67 март 1575,00 1545,33 апрель 1545,00 1575,00 май 1605,00 1578,33 июнь 1585,00 1610,33 июль 1641,00 1614,00 август 1616,00 1650,67 сентябрь 1695,00 1675,67 октябрь 1716,00 1713,00 ноябрь 1728,00 1716,33 декабрь 1705,00
Задача 2. Аналитическое выравнивание по прямой и параболе.