Статистический анализ данных выборочного наблюдения

Автор работы: Пользователь скрыл имя, 10 Апреля 2012 в 16:54, курсовая работа

Краткое описание

Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
1. Овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
2. Приобретение навыков работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
3. Развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.

Содержание работы

Введение……………………………………………………………………………………………….3

1. Сводка и группировка данных статистического наблюдения……………………………………...4
2. Вариационный анализ……………………………………………………………………………….. 8
3. Проверка гипотезы о нормальном характере распределения……………………………………...10
4. Корреляционно-регрессионный анализ……………………………………………………………. 11
5. Множественный корреляционно-регрессионный анализ………………………………………….15
6. Анализ качественных признаков……………………………………………………………...……..16
7. Интервальные оценки………………………………………………………………………………...18

Заключение………………………………………………………..………………………… ………....19
Литература………………………………………………………………………………………………20

Содержимое работы - 1 файл

Трифонова Ольга, 8202 на 5.doc

— 4.09 Мб (Скачать файл)

     Корреляционная  решетка –  это  аналитическая  группировка  единиц  совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной  решетки  можно  сделать  предположение  о  наличии  и  направлении  связи,  а также предварительную оценку тесноты связи.

 

Рассчитать эмпирическое корреляционное отношение, коэффициент детерминации

 

78-90,5

90,5-103

103-115,5

115,5-128

128-140,5

140,5-153

153-165,5

165,5-178

Общий итог

Средние

Групповые средние (EQ)

 

43-49,25

14

3

 

 

 

 

 

 

17

46,1

86,5

238,9

49,25-55,5

 

10

1

 

 

 

 

 

11

52,4

97,9

84,1

55,5-61,75

 

 

20

 

 

 

 

 

20

58,6

109,3

63,9

61,75-68

 

 

1

13

1

 

 

 

15

64,9

121,8

7,6

68-74,25

 

 

 

1

19

2

 

 

22

71,1

134,8

3,8

74,25-80,5

 

 

 

 

2

8

3

 

13

77,4

147,7

30,2

80,5-86,75

 

 

 

 

 

1

15

 

16

83,6

158,5

96,0

86,75-93

 

 

 

 

 

 

1

20

21

89,9

171,2

263,3

Общий итог

14

13

22

14

22

11

19

20

135

 

 

787,7

Средние

84,3

96,8

109,3

121,8

134,3

146,8

159,3

171,8

 

 

 

 

Групповые средние (БТП)

46,1

50,9

58,6

65,3

71,4

76,8

83,0

89,9

 

 

 

 

 

54,4

31,5

17,6

1,4

0,9

4,9

27,3

64,4

202,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсия для БТП

208,73

 

 

 

 

 

 

 

 

 

 

Факторная дисперсия для БТП

202,58

 

 

 

 

 

 

 

 

 

 

ЭКО

0,97

 

 

 

 

 

 

 

 

 

 

     В корреляционной таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.

Эмпирическое   корреляционное   отношение  (ЭКО) показывает тесноту связи между исследуемым явлением (БТП) и группировочным признаком (EQ). ЭКО изменяется в переделах от нуля до единицы. Чем ближе его значение к единице, тем сильнее корреляционная  связь между признаками. В нашем случае значение ЭКО=0,97, значит связь между БТП и EQ достаточно сильная.

Видно, что ЭКО меньше чем коэффициент корреляции. Поэтому связь между признаками БТП и EQ считаем линейной.

 

Вывод: В этом пункте рассчитано эмперическое корреляционное отношение (ЭКО). Была построена корреляционная таблица, рассчитана факторная дисперсия и дисперсия для БТП, получено ЭКО, равное 0,97. Т.к 0,97<коэффициента корреляции (1,00) можно сделать вывод, что связь между БТП и EQ линейная.

 

5. Множественный корреляционно- регрессионный анализ.

 

Применяем Регрессия из Анализа данных.

 

ВЫВОД ИТОГОВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

 

Множественный R

0,999428

 

 

 

 

 

 

 

R-квадрат

0,998856

 

 

 

 

 

 

 

Нормированный R-квадрат

0,996378

 

 

 

 

 

 

 

Стандартная ошибка

0,818799

 

 

 

 

 

 

 

Наблюдения

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

 

 

 

df

SS

MS

F

Значимость F

 

 

 

Регрессия

13

3512,527

270,1944

403,0159839

1,02886E-07

 

 

 

Остаток

6

4,022586

0,670431

 

 

 

 

 

Итого

19

3516,55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

5,75988

9,134132

0,630589

0,551555849

-16,59053549

28,1103

-16,5905

28,1103

Переменная X 1

0,026835

0,04831

0,555476

0,598653319

-0,091375611

0,145046

-0,09138

0,145046

Переменная X 2

0,186185

0,262995

0,707942

0,505538291

-0,457339532

0,829709

-0,45734

0,829709

Переменная X 3

-0,16346

0,284071

-0,57541

0,585927974

-0,858553839

0,531638

-0,85855

0,531638

Переменная X 4

0,045525

0,100539

0,45281

0,666598293

-0,200485636

0,291536

-0,20049

0,291536

Переменная X 5

-1,78099

2,527092

-0,70476

0,507381579

-7,964557588

4,402584

-7,96456

4,402584

Переменная X 6

-0,36306

0,542428

-0,66933

0,528188282

-1,690334359

0,964213

-1,69033

0,964213

Переменная X 7

0,000849

0,018587

0,045677

0,965049796

-0,044632382

0,04633

-0,04463

0,04633

Переменная X 8

0,482225

0,031312

15,40049

4,73812E-06

0,405606692

0,558844

0,405607

0,558844

Переменная X 9

-0,00077

0,000906

-0,85289

0,426450187

-0,002988628

0,001444

-0,00299

0,001444

Переменная X 10

0,001463

0,00296

0,494354

0,638632437

-0,005778965

0,008705

-0,00578

0,008705

Переменная X 11

-0,01921

1,179062

-0,01629

0,987529735

-2,904270405

2,865852

-2,90427

2,865852

Переменная X 12

-0,68404

2,154273

-0,31753

0,761602457

-5,955359037

4,587274

-5,95536

4,587274

Переменная X 13

-0,29099

0,762668

-0,38154

0,715949613

-2,157168127

1,575194

-2,15717

1,575194

    Множественно корреляционно- регрессионный анализ состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной.

 

    Анализируя полученные данные, видим, что p-значение для X8 слишком велико и необходимо исключить ее из рассмотрения.

Кажется, что нет смысла в этом примере использовать множественную регрессию для прогнозирования БТП.

 

    Вывод: В данном пункте проведен множественный корреляционно- регрессионный анализ.  Для этого применена Регрессия с помощью описательной статистики. Из полученных данных мы видим, что р-значение (4,73812Е-06) для переменной Х8 слишком велико и ее необходимо исключить из рассмотрения.  В моем примере нет смысла использовать множественную регрессию.

 

 

 

 

 

 

 

 

 

 

 

 

6. Анализ качественных признаков.

10. Расчет коэффициентов ассоциации и контингенции для признаков.

 

 

Высшее

 

 

 

Здесь

 

Пол

0

1

Общий итог

 

a=

39

0

39

28

67

 

b=

28

1

30

38

68

 

c=

30

Общий итог

69

66

135

 

d=

38

 

 

 

 

 

 

 

 

Коэффициенты:

 

 

 

 

 

Коэффициент контингенции

 

 

-1,0

 

 

 

Коэффициент ассоциации

 

 

0,1

 

 

 

Наличие судимости

 

 

 

Здесь

 

Пол

0

1

Общий итог

 

a=

58

0

58

9

67

 

b=

9

1

44

24

68

 

c=

44

Общий итог

102

33

135

 

d=

25

 

 

 

 

 

 

 

 

Коэффициенты:

 

 

 

 

 

 

Коэффициент контингенции

 

1,0

 

 

 

 

Коэффициент ассоциации

 

0,3

 

 

 

 

Коэффициенты  ассоциации   и   контингенции  применяются для определения тесноты связи двух качественных признаков., каждый который состоит только их двух групп. Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка > 0,5, а Кк > 0,3. В первом случае связь считается не подтвержденной, а во втором подтвержденной.

Коэффициент контингенции, равный -1 говорит об абсолютной отрицательной связи  качественных признаков. Коэффициент контингенции, равный +1 говорит об абсолютной положительной связи качественных признаков, а нулевое значение говорит о независимости признаков.

Но недостатком коэффициента контингенции является то, что он не различает полной и абсолютной связанности признаков, давая для этих случаев +1 или -1, т.е. этот коэффициент  существенно завышает оценку связи признаков. А у коэффициента ассоциации этого недостатка нет. Коэффициент ассоциации при независимости признаков также равен нулю, а значения +1, -1 принимает только при абсолютной связанности признаков.

  Вывод: В этом пункте проведен анализ качественных признаков. В результате были получены коэффициент контингенции, равный -1,0 в первом случае, и 1,0 во втором, и коэффициент ассоциации, равный 0,1 в первом случае, и 0,3 во втором. В первом случае  связь  качественных признаков считается не подтвержденной (Кк< 0,3), а во втором- подтвержденной (Кк> 0,3).

11 Расчет коэффициента Спирмена.

 

Табельный номер сотрудника

Баллы по тренингу "Сервисное обслуживание"

Баллы по тренингу "Новая техника"

Ранг БТСО

Ранг для БТНТ

1

103

25

73

81

2

101

24

69

75

3

153

9

133

28

4

73

26

32

83

5

74

32

35

105

6

64

33

24

110

7

73

34

33

116

8

123

18

103

55

9

73

34

34

117

10

144

4

129

17

11

124

16

105

50

12

92

32

52

107

13

120

2

91

11

14

63

35

17

120

15

61

39

14

133

16

112

27

83

89

17

93

13

56

38

18

133

0

117

6

19

121

-4

95

4

20

60

37

11

126

21

140

10

124

30

22

80

26

41

84

23

122

3

98

14

24

84

24

46

74

25

111

12

81

33

26

82

35

42

122

27

114

23

88

71

28

130

12

109

35

29

104

21

78

66

30

102

21

71

64

31

70

37

26

129

32

132

13

116

43

33

74

33

36

112

34

91

13

51

36

35

60

31

12

98

36

100

13

64

39

37

122

21

99

68

38

53

38

6

131

39

102

21

72

65

40

52

41

4

135

41

140

3

125

15

42

114

22

89

69

43

124

6

106

21

44

54

36

10

123

45

120

21

92

67

46

122

2

100

12

47

74

32

37

106

48

100

31

65

101

49

124

11

107

31

50

90

31

48

99

51

153

-5

134

3

52

53

35

7

119

53

121

1

96

7

54

62

38

16

132

55

100

28

66

91

56

63

29

18

92

57

133

18

118

57

58

112

13

84

41

59

70

33

27

111

60

74

21

38

62

61

103

27

74

88

62

93

27

57

87

63

50

37

1

124

64

84

25

47

78

65

133

15

119

48

66

130

4

110

16

67

103

13

75

40

68

63

35

19

121

69

103

9

76

26

70

131

16

113

51

71

53

37

8

125

72

64

30

25

96

73

94

29

61

95

74

154

-7

135

1

75

104

19

79

59

76

61

37

15

127

77

114

25

90

82

78

130

2

111

13

79

133

14

120

45

80

131

7

114

22

81

101

14

70

44

82

120

19

93

60

83

71

27

29

85

84

113

13

86

42

85

82

37

43

130

86

71

32

30

104

87

93

28

58

90

88

122

1

101

8

89

51

32

3

102

90

143

17

127

52

91

134

19

122

61

92

93

21

59

63

93

112

18

85

54

94

151

5

132

19

95

70

25

28

77

96

60

32

13

103

97

74

24

39

73

98

113

6

87

20

99

94

33

62

114

100

120

10

94

29

101

133

7

121

23

102

100

32

67

108

103

144

8

130

25

104

90

12

49

32

105

104

15

80

47

106

144

18

131

58

107

50

35

2

118

108

63

29

20

93

109

143

5

128

18

110

83

27

44

86

111

74

29

40

94

112

100

15

68

46

113

93

25

60

80

114

122

1

102

9

115

52

31

5

97

116

92

31

53

100

117

134

-6

123

2

118

92

13

54

37

119

63

33

21

109

120

121

12

97

34

121

63

37

22

128

122

94

16

63

49

123

123

24

104

76

124

103

18

77

53

125

111

2

82

10

126

83

23

45

70

127

130

-3

112

5

128

71

24

31

72

129

53

40

9

134

130

90

25

50

79

131

63

34

23

115

132

131

18

115

56

133

124

9

108

27

134

140

7

126

24

135

92

33

55

113

 

rs=

-0,8283192

12 Расчет коэффициента Кендалла

 

Табельный номер сотрудника

Ранг БТСО

Ранг для БТНТ

Совпадения

Инверсии

Вспомогательный столбец

74

135

1

0

134

1

117

123

2

11

122

1

51

134

3

0

132

1

19

95

4

37

94

1

127

112

5

20

110

1

18

117

6

15

114

1

53

96

7

34

94

1

88

101

8

29

98

1

114

102

9

28

98

1

125

82

10

44

81

1

13

91

11

35

89

1

46

100

12

28

95

1

78

111

13

19

103

1

23

98

14

28

93

1

41

125

15

8

112

1

66

110

16

18

101

1

10

129

17

4

114

1

109

128

18

4

113

1

94

132

19

1

115

1

98

87

20

30

85

1

43

106

21

18

96

1

80

114

22

13

100

1

101

121

23

7

105

1

134

126

24

4

107

1

103

130

25

2

108

1

69

76

26

34

75

1

133

108

27

12

96

1

3

133

28

0

107

1

100

94

29

17

89

1

21

124

30

2

103

1

49

107

31

10

94

1

104

49

32

55

48

1

25

81

33

24

78

1

120

97

34

14

87

1

28

109

35

9

91

1

34

51

36

50

49

1

118

54

37

47

51

1

17

56

38

45

52

1

36

64

39

37

59

1

67

75

40

26

69

1

58

84

41

20

74

1

84

86

42

18

75

1

32

116

43

6

86

1

81

70

44

27

64

1

79

120

45

3

87

1

112

68

46

27

62

1

105

80

47

18

70

1

65

119

48

3

84

1

122

63

49

28

58

1

11

105

50

6

79

1

70

113

51

5

79

1

90

127

52

1

82

1

124

77

53

16

66

1

93

85

54

12

69

1

8

103

55

5

75

1

132

115

56

3

76

1

57

118

57

2

76

1

106

131

58

0

77

1

75

79

59

9

67

1

82

93

60

3

72

1

91

122

61

0

74

1

60

38

62

36

37

1

92

59

63

19

53

1

30

71

64

11

60

1

39

72

65

10

60

1

29

78

66

7

62

1

45

92

67

2

66

1

37

99

68

1

66

1

42

89

69

2

64

1

126

45

70

22

43

1

27

88

71

2

62

1

128

31

72

33

30

1

97

39

73

26

36

1

24

46

74

20

41

1

2

69

75

5

55

1

123

104

76

0

59

1

95

28

77

31

27

1

64

47

78

17

40

1

130

50

79

15

41

1

113

60

80

9

46

1

1

73

81

3

51

1

77

90

82

0

53

1

4

32

83

23

29

1

22

41

84

16

35

1

83

29

85

23

27

1

110

44

86

13

36

1

62

57

87

8

40

1

61

74

88

1

46

1

16

83

89

0

46

1

87

58

90

5

40

1

55

66

91

1

43

1

56

18

92

26

17

1

108

20

93

24

18

1

111

40

94

10

31

1

73

61

95

3

37

1

72

25

96

17

22

1

115

5

97

34

4

1

35

12

98

27

10

1

50

48

99

6

30

1

116

53

100

4

31

1

48

65

101

1

33

1

89

3

102

31

2

1

96

13

103

23

9

1

86

30

104

11

20

1

5

35

105

8

22

1

47

37

106

6

23

1

12

52

107

3

25

1

102

67

108

0

27

1

119

21

109

12

14

1

6

24

110

9

16

1

59

27

111

7

17

1

33

36

112

4

19

1

135

55

113

1

21

1

99

62

114

0

21

1

131

23

115

5

15

1

7

33

116

3

16

1

9

34

117

2

16

1

107

2

118

16

1

1

52

7

119

13

3

1

14

17

120

5

10

1

68

19

121

4

10

1

26

42

122

1

12

1

44

10

123

7

5

1

63

1

124

11

0

1

71

8

125

8

2

1

20

11

126

6

3

1

76

15

127

4

4

1

121

22

128

2

5

1

31

26

129

1

5

1

85

43

130

0

5

1

38

6

131

3

1

1

54

16

132

0

3

1

15

14

133

0

2

1

129

9

134

0

1

1

40

4

135

0

0

1

 

 

 

1750

7295

 

 

 

 

P

Q

 

 

Тогда τ =

-0,61

Информация о работе Статистический анализ данных выборочного наблюдения