Самые популярные страны для туризма в 2007 году

Автор работы: Пользователь скрыл имя, 17 Апреля 2011 в 00:45, практическая работа

Краткое описание

Для анализа стран, популярных для туристов в 2007 году были взяты данные с сайта www.rating.rbc.ru. Исходные данные представлены в таблице 1.

Содержимое работы - 1 файл

Волкова_Сиверухина_649гр.doc

— 176.50 Кб (Скачать файл)
 

Федеральное агентство по образованию

Государственное образовательное  учреждение высшего

профессионального образования

«Нижегородский  государственный  университет им. Н. И. Лобачевского»

 

Механико - математический факультет

Кафедра математического моделирования экономических систем 
 
 
 

Исследовательская работа 

Самые популярные страны для туризма в 2007 году 
 

Исполнитель:

студенты 4 курса

Волкова М.А.

Сиверухина  А.С. 
 

Научный руководитель:

Буреева Н.Н. 
 
 
 
 

Нижний  Новгород, 2008

 
 

     Для анализа стран, популярных для туристов в 2007 году были взяты данные с сайта www.rating.rbc.ru. Исходные данные представлены в таблице 1.

Таблица 1

Самые популярные у туристов страны в 2007 году
Страна Туризм Служебная Частная ПМЖ Персонал
    Y X1 X2 X3 X4
1 Турция 1923363 71765 244539 264 154928
2 Китай 1651715 500497 537957 18 190619
3 Египет 1255399 6543 71604 230 75783
4 Финляндия 657138 279799 1266217 15851 578929
5 Италия 334113 46388 65410 495 35685
6 Испания 318639 16036 39271 799 24294
7 Украина 249051 260795 7021178 8275 287858
8 Греция 243958 6317 30218 355 25445
9 Таиланд 232247 8133 8175 41 14830
10 Германия 231318 184881 357891 8743 79438
11 ОАЭ 207205 15691 30507 188 17498
12 Чехия 177955 23047 31130 134 12436
13 Болгария 173101 6574 21157 146 16606
14 Франция 170665 58391 54397 425 25059
15 Кипр 150520 5267 18441 83 9539
16 Тунис 129749 690 4191 4 5586
17 Польша 109046 17969 567499 789 42621
18 Хорватия 100051 2584 5752 6 7972
19 Англия 79231 57733 82353 956 17889
20 Австрия 76972 25943 38221 661 8843
21 Черногория 66454 477 2522 4 5114
22 Литва 63769 41302 719224 1957 50563
23 Швейцария 57639 34000 47535 722 7155
24 Сербия 55254 6327 18064 17 10142
25 Индия 53251 7556 4045 13 10816
26 Израиль 45314 7104 83992 4200 11198
27 Нидерланды 32965 27702 21892 157 14614
28 США 32800 31277 63675 1133 10763
29 Корея, 32573 21072 28068 626 37256
30 Латвия 31951 37144 108079 87 19128
 
  1. Проверка  наличия корреляции.

Построим корреляционную матрицу, используя функцию «Сервис. Анализ данных. Корреляция» MS Excel. 

  Y X1 X2 X3 X4
Y 1,000        
X1 0,528 1,000      
X2 0,049 0,469 1,000    
X3 0,053 0,523 0,509 1,000  
X4 0,440 0,709 0,532 0,835 1,000
 

      Из  матрицы следует, что наблюдается  корреляция между факторами X3 и X4 (т.к. rx3x4=0,835), а так же X1 и X4 (т.к. rx1x4=0,709).

  1. Тест Чоу

      Тест  Чоу позволяет отследить наличие  структурных преобразований. При  моделировании реальных процессов модель, которая строится по всей выборке данных, может не совсем отражать реальную картину в связи с тем, что период выборки характеризуется структурными экономическими изменениями.

      Для проведения теста Чоу разобьем имеющуюся  выборку на две подвыборки, характеризующиеся числом наблюдений n1=16 и n2=14. Оценим параметры моделей для числа наблюдений n1 и n2 и вычисляем остаточные суммы квадратов ESS1 и ESS2. Затем оцениваем параметры модели по объединенной выборке, т.е. для наблюдений n=30 и вычисляем значение остаточной суммы квадратов ESS.

 Результаты  записаны в таблице 2.

      Таблица 2

ESS1 ESS2 ESS
1,9261E+12 5267575883 2,60914E+12
 

  Вычисляем критическое значение критерия Чоу  по формуле:

  

F Fтабл.
1,403707324 3,325834529
 

      Значение  F сравниваем с F табл. Т.к. F<Fтабл. делаем вывод, что структурные изменения отсутствуют, и данные можно рассматривать как единое целое.

  1. Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия».

Таблица 3

Множественный R 0,771
R-квадрат 0,595
Нормированный R-квадрат 0,530
Стандартная ошибка 323056,506
Наблюдения 30,000
 

Таблица 4

  Коэффициенты Стандартная ошибка t-статистика
Y-пересечение 172862,555 68745,483 2,515
Переменная X 1 1,506 0,807 1,866
Переменная X 2 -0,081 0,057 -1,427
Переменная X 3 -123,800 32,462 -3,814
Переменная X 4 4,333 1,156 3,750
t табл.
2,048

    Для модели множественной регрессии  R2 возрастает при добавлении каждого нового регрессора., поэтому принято использовать скорректированный R2. Чем ближе R2 к единице, тем выше качество подгонки модели к реальным данным.

R^2 скор 0,949854
 

    Уравнение регрессии имеет вид:

    Y=172862+1,506X1-0,081X2-123,8X3+4,333X4

  1. Определение мультиколлинеарности

      Необходимо  проверить три основных признака, по которым может быть установлено наличие мультиколлинеарности. Проанализируем данные приведенные в таблицах 3,4.

     Во-первых,  коэффициент R2 не достаточно высок, но некоторые коэффициенты регрессии статистически незначимы, т.е. они имеют низкие t –статистики.

     Во-вторых, парная корреляция между объясняющими переменными X3 и X4 достаточно высока.

     В-третьих, высокие коэффициенты корреляции (таблица 5), которые вычисляются по формуле

Таблица 5

1,000 0,760 -0,176 -0,238
0,760 1,000 0,323 0,433
-0,176 0,323 1,000 0,293
-0,238 0,433 0,293 1,000
 

     Мультиколлинеарность  может иметь место вследствие того, что какая-нибудь из объясняющих переменных является линейной комбинацией других объясняющих переменных. Для анализа строим уравнение регрессии каждой из объясняющих переменных, и вычисляются соответствующие коэффициенты детерминации R2 и F-статистика (результат представлен в таблице 6).

Таблица 6

  X1 X2 X3 X4 F табл.
F 9,978 4,083 21,821 34,911 8,630
R^2 0,535 0,320 0,716 0,801  
 

     Если  коэффициент R2 статистически незначим, то X не является линейной комбинацией других переменных и ее можно оставить в уравнении регрессии.

     Исключение  из модели одной или нескольких коррелированных  переменных является простейшим методом  устранения мультиколлинеарности. Приходим к выводу, что объясняющую переменную X4 можно исключить из модели. Строим регрессию по переменным X1, X2, X3.

Таблица 7

  Коэффициенты Стандартная ошибка
Y-пересечение 183022,720 84193,766
Переменная X 1 3,183 0,823
Переменная X 2 -0,063 0,069
Переменная X 3 -33,194 26,567
 
  1. Гетероскедастичность – это непостоянство дисперсий ошибок регрессии.

      Для обнаружения гетероскедастичности воспользуемся тестом ранговой корреляции Спирмена. Результат представим в виде таблицы 8.

Таблица 8

  X1 X2 X3
t 2,376 -0,617 1,025
t табл. 2,048    
 

Т.к. t>t табл. в переменной X1, то отклоняем гипотезу об отсутствии гетероскедастичности.

      Не  существует какого-либо однозначного метода определения гетероскедастичности, поэтому воспользуемся тестом Парка для проверки полученных результатов.

Таблица 9

  X1 X2 X3
2,745 1,368 -0,660
t табл. 2,048    
 

При анализе  таблицы 9 подтверждается наличие гетероскедастичности, т.к. >t табл. в переменной X1.

Информация о работе Самые популярные страны для туризма в 2007 году