Статистика

Автор работы: Пользователь скрыл имя, 16 Марта 2012 в 17:10, курсовая работа

Краткое описание

Простейшим из показателей данной группы является вариационный размах. Он равен 51 (в нашем случае). Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.

Содержание работы

 Введение…………………………………………………………………………………………………………6
 Пункт A. Сводка и группировка данных, числовая статистика………………………………………….. 7
 Пункт B. Проверка гипотез…………………………………………………………………………………...13
 Пункт C. Корреляционно-регрессионный анализ…………………………………………………………..15
 Пункт D. Множественный корреляционно-регрессионный анализ……………………………………….20
 Пункт E. Анализ качественных признаков…………………………………………………………………..23
 Пункт G. Интервальные оценки………………………………………………………………………………24
 Вывод…………………………………………………………………………………………………………….25
 Список литературы……………………………………………………………………………………………..27

Содержимое работы - 1 файл

Шакирова Альбина(2003).doc

— 1.44 Мб (Скачать файл)

 

                         Казанский Государственный Технический Университет им. А.Н. Туполева

                                                   Кафедра «Динамики и процессов управления»

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Курсовая работа по дисциплине «Статистика»

 

 

 

 

 

 

 

 

 

 

 

             

 

                                                                                   Руководитель:

Сабитов Ш.Р.

Автор:

Студентка группы 8207:

Шакирова А.А.

 

 

 

                                                                                        Казань

                                                                                          2010 г.

 

Содержание:

        Введение…………………………………………………………………………………………………………6

        Пункт A. Сводка и группировка данных, числовая статистика………………………………………….. 7

        Пункт B. Проверка гипотез…………………………………………………………………………………...13

        Пункт C. Корреляционно-регрессионный анализ…………………………………………………………..15

        Пункт D. Множественный корреляционно-регрессионный анализ……………………………………….20

        Пункт E. Анализ качественных признаков…………………………………………………………………..23

        Пункт G. Интервальные оценки………………………………………………………………………………24

        Вывод…………………………………………………………………………………………………………….25

        Список литературы……………………………………………………………………………………………..27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табельный номер

Разряд продавца

Баллы по тренингу "Продажи"

Баллы по тренингу "Новая техника"

Баллы по тренингу "Сервисное обслуживание"

Кол-во жалоб от покупателей за год

Возраст

Опыт работы

Пол

IQ

EQ

Средняя зарплата/месяц

Средняя премия/месяц

Высшее

Высшее техническое

Наличие судимости

Годовой объем продаж

1

3

85

24

83

3

38

7

ж

114

163

7064

1345

0

0

0

4679,798

2

2

76

38

63

4

23

5

м

132

145

6523

1478

0

0

1

3890,568

3

2

84

2

121

2

49

11

ж

136

158

8305

1972

1

0

0

6291,815

4

3

93

13

110

1

47

10

м

128

178

7964

1330

0

0

0

5525,68

5

3

85

26

83

2

35

7

ж

125

164

7675

1498

0

0

0

5149,423

6

2

84

13

104

3

41

9

м

154

158

7882

1739

0

0

1

5218,117

7

2

63

4

132

8

59

12

ж

94

117

8935

1118

0

0

0

5637,52

8

2

58

29

92

7

34

8

ж

133

107

7680

2193

1

1

1

4401,294

9

3

87

39

64

2

20

5

ж

120

164

6919

1456

0

0

0

4222,165

10

2

80

19

111

4

48

10

ж

144

152

8336

1857

1

0

0

5919,302

11

1

52

28

83

7

31

7

м

115

95

7437

985

0

0

1

3671,662

12

2

51

19

132

10

55

12

ж

166

93

7929

2342

1

1

0

5217,038

13

2

88

24

110

2

43

10

м

78

167

7234

1172

0

0

0

5383,201

14

2

64

23

111

8

49

10

м

81

121

8372

1406

1

0

0

5437,585

15

2

58

24

103

7

41

9

ж

101

111

7152

2138

1

1

0

4714,941

16

1

43

23

92

9

37

8

м

161

78

7390

2147

1

1

1

4249,6

17

3

92

39

50

1

20

4

м

92

176

6386

2127

1

0

0

4068,028

18

2

63

15

103

6

43

9

ж

168

121

7527

1513

0

0

0

4791,916

19

2

50

30

72

8

24

6

м

113

94

6337

1137

0

0

0

3844,307

20

2

52

25

84

10

33

7

м

169

99

6805

1442

0

0

1

4084,104

21

2

61

8

151

7

63

14

ж

125

113

8327

2094

1

1

0

6363,924

22

1

50

23

103

12

43

9

ж

121

95

7987

1531

1

0

0

5052,084

23

2

44

35

83

12

27

7

ж

143

82

7226

1070

0

0

0

4232,719

24

2

65

21

73

6

30

6

м

112

119

7352

1423

0

0

0

4106,045

25

2

51

33

70

12

22

6

ж

141

94

6478

2171

1

1

0

3925,936

26

2

57

20

91

6

39

8

ж

153

108

7543

1914

1

0

0

4603,959

27

2

85

17

144

2

59

13

м

106

163

8579

1468

0

0

0

7328,35

28

2

86

6

122

2

49

11

ж

85

163

7989

2396

1

1

0

6309,245

29

2

80

30

61

3

21

5

м

155

149

6677

1497

0

0

1

3807,861

30

2

54

19

143

7

58

13

м

118

103

7939

1460

1

0

1

6635,424

31

2

72

19

83

4

33

7

м

163

137

7159

1243

0

0

0

4570,483

32

3

90

15

103

2

45

9

м

148

169

7356

1975

1

0

1

5210,108

33

2

54

29

70

10

24

6

м

142

102

6417

1615

1

0

1

4002,383

34

3

85

12

100

2

42

9

ж

123

162

7400

1475

0

0

0

4995,243

35

3

79

25

100

3

45

9

ж

158

151

7890

1840

1

0

0

5492,177

36

2

70

34

60

4

23

5

м

137

130

6498

1673

1

0

1

3745,219

37

2

80

33

63

3

20

5

ж

120

151

6904

1932

1

0

0

3681,896

38

1

48

31

83

10

28

7

ж

85

88

6474

1849

1

1

0

4007,394

39

2

59

28

62

8

23

5

ж

169

112

6586

2453

1

1

0

3336,289

40

3

82

30

62

3

27

5

ж

173

159

6772

1440

0

0

1

3807,492

41

2

62

13

100

8

39

9

ж

105

118

7138

1182

0

0

0

4809,031

42

2

68

25

72

7

32

6

ж

84

126

7306

940

0

0

0

3928,966

43

3

80

6

134

3

57

12

м

177

152

8296

2408

1

1

0

6205,729

44

2

79

13

104

4

38

9

м

155

148

7811

1389

0

0

0

5874,459

45

2

86

7

103

3

47

9

м

83

164

7606

2270

1

1

1

5660,22

46

2

57

6

130

8

58

12

ж

173

105

7962

1375

0

0

0

6132,896

47

2

58

28

60

10

24

5

ж

172

106

7049

2187

1

1

0

3434,625

48

1

51

9

102

10

46

9

м

94

92

7335

849

0

0

0

5027,656

49

2

75

11

100

4

40

9

м

98

142

7547

1091

0

0

0

5222,54

50

2

77

18

102

4

43

9

м

111

146

8090

2328

1

1

0

5112,696

51

2

70

34

60

5

20

5

ж

143

134

6001

1960

1

0

0

3650,221

52

2

69

31

72

5

26

6

м

158

133

7174

1885

1

0

1

3991,879

53

3

91

-1

124

1

51

11

м

145

175

7648

2621

1

1

0

6955,984

54

2

62

19

91

7

34

8

ж

117

118

7580

2221

1

1

0

4344,439

55

2

73

20

82

6

33

7

ж

123

135

7575

1095

0

0

0

4449,698

56

2

58

23

72

7

29

6

ж

105

106

7363

2048

1

1

0

3615,538

57

1

52

13

142

7

59

13

ж

81

99

8698

2179

1

1

0

6267,763

58

1

42

21

91

11

40

8

м

121

78

7541

1655

1

0

1

3931,086

59

2

89

-2

142

2

59

13

м

102

168

8511

2111

1

0

0

7597,159

60

1

45

12

123

13

50

11

м

143

82

7961

1321

0

0

0

5511,538

61

2

45

5

130

12

57

12

ж

173

84

7930

1722

1

0

0

5839,523

62

2

45

15

102

9

37

9

м

167

83

6940

1272

0

0

0

4467,018

63

2

82

19

84

4

33

7

м

136

158

7112

1258

0

0

1

4448,791

64

2

68

26

73

7

25

6

ж

177

128

7122

2392

1

1

0

3795,137

65

3

83

4

133

4

60

12

ж

178

157

8695

1672

0

0

0

7111,62

66

2

53

27

62

10

26

5

ж

145

96

7117

1404

0

0

0

3175,176

67

2

54

20

124

9

50

11

м

102

102

8017

1315

0

0

1

5539,513

68

2

58

20

120

7

52

11

ж

140

109

8113

1273

0

0

0

5238,062

69

1

46

10

140

12

62

13

м

128

82

8637

1383

1

0

1

6106,926

70

3

79

20

144

3

60

13

м

146

151

8106

1626

0

0

1

6611,669

71

2

71

23

101

4

41

9

м

176

136

7197

1917

1

0

0

4792,612

72

3

90

2

120

2

54

11

ж

99

169

7844

1475

0

0

0

6340,387

73

2

64

14

90

8

38

8

ж

128

121

7589

1356

0

0

0

4781,29

74

2

51

38

64

9

23

5

ж

162

91

6735

1106

0

0

0

3186,8

75

1

43

24

104

13

37

9

м

149

79

7629

2209

1

1

1

4753,799

76

3

88

18

132

2

53

12

м

171

171

8378

1645

0

0

0

6823,139

77

2

73

12

141

5

60

13

м

121

139

8164

1468

0

0

1

7214,573

78

1

43

10

110

9

48

10

м

154

80

7729

2062

1

1

0

4830,874

79

2

51

35

70

11

25

6

м

178

95

7125

1288

0

0

1

4042,2

80

2

68

26

64

7

24

5

м

155

129

6229

1777

1

0

1

3777,727

81

2

77

24

114

4

46

10

м

151

145

8206

1659

0

0

0

6243,209

82

2

58

39

62

9

23

5

ж

105

110

6946

1001

0

0

0

3632,52

83

2

63

30

72

6

27

6

ж

177

118

6887

1398

0

0

0

4141,537

84

1

47

17

123

8

50

11

м

139

84

8114

1434

1

0

1

5656,744

85

2

56

15

90

7

43

8

ж

124

103

7532

1673

1

0

0

4864,642

86

2

62

15

114

6

44

10

м

93

115

7769

1639

1

0

0

5457,271

87

2

55

34

94

7

35

8

м

153

102

7592

2449

1

1

1

4028,452

88

2

56

21

101

7

42

9

м

131

106

7459

1922

1

0

0

4941,518

89

2

81

22

83

4

28

7

м

134

151

7211

1552

0

0

0

4804,244

90

2

57

3

112

6

52

10

ж

117

106

8210

1379

0

0

0

5631,851

91

2

61

0

144

6

58

13

ж

136

113

8198

1242

0

0

0

6458,315

92

2

82

30

64

4

20

5

м

82

159

6959

2020

1

0

0

3808,988

93

1

50

8

101

9

44

9

ж

111

90

7514

877

0

0

0

5056,14

94

2

52

24

123

9

49

11

м

128

94

7605

1008

0

0

1

5445,016

95

2

76

-2

132

3

63

12

ж

83

144

8359

1735

1

0

0

6254,095

96

2

75

37

61

4

22

5

м

164

145

6178

2123

1

0

0

4183,765

97

2

66

29

90

6

38

8

м

143

126

7556

1878

1

0

0

4487,802

98

2

84

-3

134

2

55

12

м

105

157

8197

1410

0

0

1

6314,414

99

2

76

5

110

4

48

10

ж

108

142

7631

2343

1

1

0

5375,794

100

2

80

23

102

3

48

9

ж

81

153

7826

1961

1

0

0

5437,184

101

2

56

18

114

10

47

10

м

124

102

8098

2172

1

1

1

5675,961

102

2

80

1

123

4

54

11

м

104

152

7965

2397

1

1

0

5671,704

103

2

76

30

72

5

26

6

м

83

144

6839

1670

1

0

1

4122,741

104

3

88

15

141

2

64

13

ж

124

166

8355

2597

1

1

0

6752,536

105

2

79

15

120

4

54

11

м

137

150

8458

1537

0

0

0

6364,151

106

2

73

40

63

4

21

5

м

136

141

6819

2532

1

1

0

4032,528

107

1

53

-13

131

10

64

12

ж

95

100

8394

1459

1

0

0

6280,845

108

2

72

-8

132

6

62

12

м

170

137

8610

2255

1

1

0

6562,455

109

2

82

5

144

3

57

13

м

137

153

7905

1674

0

0

1

7164,671

110

2

55

-2

141

7

62

13

м

156

100

8282

1388

0

0

1

6524,063

111

2

71

-2

131

6

64

12

м

161

135

9085

1472

0

0

0

6719,966

112

2

59

21

91

8

35

8

м

108

110

6899

1443

1

0

1

5021,007

113

2

67

27

72

7

23

6

ж

84

127

6658

2174

1

1

0

3882,984

114

1

50

17

104

7

36

9

м

139

89

7541

995

0

0

0

5114,935

115

2

54

19

124

10

53

11

м

167

102

8007

1495

0

0

0

5154,146

116

3

90

15

112

2

52

10

м

161

171

8071

2617

1

1

1

5845,272

117

2

56

36

54

10

19

4

м

161

106

6162

1313

0

0

0

3128,85

118

2

76

8

144

5

56

13

м

176

142

8320

1897

1

0

1

6663,032

119

3

89

35

64

2

23

5

ж

121

170

6319

1268

0

0

0

4197,26

120

2

70

0

131

7

63

12

ж

91

132

8884

1184

0

0

0

6377,176

121

1

51

14

103

11

36

9

ж

119

95

7743

1624

1

0

0

4859,774

122

2

53

24

72

9

29

6

ж

166

97

6756

1961

1

0

0

3819,973

123

2

84

-10

131

3

62

12

м

104

163

8965

2370

1

1

0

6965,026

124

2

86

32

61

2

21

5

м

82

167

6242

1216

0

0

1

4424,326

125

3

89

15

103

2

37

9

ж

169

170

7651

2290

1

0

0

5937,398

126

2

56

34

40

7

18

3

ж

135

104

6132

1272

0

0

0

2889,373

127

2

68

2

114

7

49

10

м

170

128

8046

1212

0

0

0

5521,913

128

1

51

33

80

11

32

7

м

135

92

7064

1209

0

0

0

4159,437

129

1

51

19

82

10

35

7

ж

94

95

7051

873

0

0

0

4262,641

130

2

58

29

81

8

37

7

ж

178

105

7725

1931

1

0

0

3869,462

131

2

70

6

100

5

49

9

ж

122

131

7934

2151

1

1

0

5421,559

132

1

50

24

84

11

29

7

ж

78

90

6975

1991

1

1

0

4416,159

133

2

49

18

144

8

60

13

ж

122

89

8571

1081

0

0

0

6109,164

134

2

71

19

90

4

38

8

м

87

133

6939

1772

1

0

0

4452,495

135

2

86

29

91

2

34

8

ж

148

161

7327

2464

1

1

0

5067,586

136

3

84

7

114

2

48

10

ж

177

159

7844

2649

1

1

1

6144,594

137

3

89

24

111

1

50

10

м

117

170

8036

1376

0

0

0

5808,391

138

2

68

21

91

6

39

8

ж

137

125

7837

2125

1

1

0

4275,955

139

2

62

30

84

9

30

7

м

93

117

6543

2095

1

1

1

4320,886

140

2

67

23

82

7

32

7

ж

82

127

7555

1676

1

0

0

4769,242

141

1

56

25

100

9

45

9

ж

97

102

8196

1161

0

0

0

4736,267

142

2

89

7

141

2

61

13

м

119

169

8277

2496

1

1

0

6983,711

143

3

87

-6

142

2

60

13

м

133

167

8254

2416

1

1

0

7636,687

144

3

87

20

121

3

51

11

ж

167

165

7792

1506

0

0

0

5976,703

145

2

62

33

51

5

21

4

м

113

117

6393

1092

0

0

0

3169,274

146

3

90

16

92

2

38

8

м

112

172

7778

1611

0

0

1

5432,361

147

2

50

34

61

11

22

5

ж

153

94

6705

1354

0

0

0

3674,386

148

2

63

11

124

6

49

11

м

149

117

7755

1292

0

0

1

5777,044

149

1

51

19

101

12

41

9

ж

127

95

7436

2276

1

1

0

4694,307

150

2

58

23

133

8

54

12

м

83

109

8089

2287

1

1

1

5838,73

151

1

50

32

82

9

32

7

ж

147

93

7123

1962

1

1

0

4061,944

152

2

72

33

72

5

28

6

м

109

136

6878

2230

1

1

0

4384,64

153

2

74

3

134

5

62

12

м

86

139

8652

1133

0

0

0

6085,767

154

1

49

34

73

8

27

6

ж

95

91

6573

840

0

0

0

3546,152

155

2

57

15

122

9

49

11

ж

118

109

7859

1247

0

0

0

5099,652

156

3

90

28

102

1

42

9

м

111

171

7442

2263

1

1

0

5203,433

157

3

78

3

113

3

48

10

ж

153

146

7979

1566

0

0

0

5073,068

158

2

55

12

101

9

45

9

ж

118

102

7693

1159

0

0

0

4626,472

159

2

74

19

103

4

42

9

ж

166

142

7208

2612

1

1

0

4973,723

160

2

48

2

120

9

52

11

м

145

91

8557

1886

1

0

0

5828,041

 

 

Введение.

 

Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.

           Курсовой проект включает задания, позволяющие освоить применение методов статистики для решения конкретных задач управления. Охватывает разделы «Сводка и группировка данных», «Вариационный анализ», «Моделирование рядов распределения», «Выборочное распределение», «Корреляционно-регрессионный анализ», «Ряды динамики».

Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:

овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;

приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений виде;

развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А-1. Сводка и группировка данных.

1-2. По формуле Стерждесса ( n=1+3,322*LOG(160) ) определим ширины и границы интервалов для данных по баллам всех тренингов.

Число групп: n=8,3220866 округляя до целого: n=8

3. Используя модуль "Описательная статистика" инструмента "Анализ данных" получаем значения минимального и максимального элементов для изучаемых признаков.

Тренинги "Продажи"

Тренинги "Новая техника"

Тренинги "Сервисное обслуживание"

Среднее

67,2

Среднее

18,76875

Среднее

100,15

Стандартная ошибка

1,146974418

Стандартная ошибка

0,919658719

Стандартная ошибка

2,101440806

Медиана

67

Медиана

19,5

Медиана

101,5

Мода

51

Мода

19

Мода

72

Стандартное отклонение

14,50820631

Стандартное отклонение

11,63286489

Стандартное отклонение

26,58135725

Дисперсия выборки

210,4880503

Дисперсия выборки

135,3235456

Дисперсия выборки

706,5685535

Эксцесс

-1,31327182

Эксцесс

-0,46619186

Эксцесс

-1,00254215

Асимметричность

0,099185833

Асимметричность

-0,36757008

Асимметричность

-0,02088328

Интервал

51

Интервал

53

Интервал

111

Минимум

42

Минимум

-13

Минимум

40

Максимум

93

Максимум

40

Максимум

151

Сумма

10752

Сумма

3003

Сумма

16024

Счет

160

Счет

160

Счет

160

 

Ширину интервала находим, поделив разность максимального и минимального значений на число групп n

(Xmax-Xmin)/n:

Ширина интервала h1=6,4              Ширина интервала h2=6,6                    Ширина интервала h3=14

 

4. Простые группировки между признаком «БТП» и остальными

После мы создаем простые группировки между признаками «БТП» и другими. Заданную задачу мы решаем с помощью сводных таблиц.  Сводная таблица – это динамическая итоговая таблица, обобщающая результаты базы данных. Используются для суммирования, анализа, исследования и представления сводных данных. Диаграммы и графики представляют возможность наглядно проиллюстрировать результаты анализа. Также позволяют принимать решения и делать выводы на основе полученной информации, производить громоздкие вычисления.

Графики часто используются для иллюстрации непрерывных данных. Они полезны для выявления тенденций.

Диаграмма – это визуальное представление числовых значений. Представление числовых данных в форме наглядных диаграмм  делает эти данные более понятными и доступными. Диаграмма позволяет  визуально заметить тенденцию или повторяемость данных, которые в таблице остались бы незамеченными.

Гистограмма – один из наиболее популярных типов диаграмм. Гистограммы часто используются для сравнения дискретных данных. Они могут иллюстрировать как отличия данных одного ряда между собой, так и отличия между разными рядами.

 

 

Значения

 

Баллы по тренингу "Продажи"

Количество по полю Табельный номер

Среднее по полю Баллы по тренингу "Новая техника"

42-50,5

21

20,24

50,5-59

41

21,61

59-67,5

19

19,16

67,5-76

23

18,74

76-84,5

29

14,76

84,5-93

27

17,37

Общий итог

160

18,77


График зависимость БТП и баллы по тренингу «Новая техника».
Судя по графику и таблице можно сделать вывод, что наибольшее количество баллов БТП в диапазоне 50,5-59 набрало 41 чел. Наименьшее количество баллов по БТП в диапазоне 76-84,5 набрало 29 человек. Большее количество человек (41) набрали в диапазоне 50,5-59

 

Баллы по треннингу "Продажи"

Среднее по полю Баллы по тренингу "Сервисное обслуживание"

42-50,5

101,19

50,5-59

96,95

59-67,5

96,68

67,5-76

92,61

76-84,5

106,41

84,5-93

106,33

Общий итог

100,2


По результатам, полученным в таблице и на графике, можно сделать вывод о следующем: наибольшее усредненное количество баллов(106,41)набрали участники, находившиеся в диапазоне  от 76 до 84,5 баллов по БТП; наихудший же усредненный результат(92,61) по тренингу сервисное обслуживание показали участники, набравшие от 67,5 до 76.

 

Баллы по треннингу "Продажи"

Среднее по полю Опыт работы

42-50,5

8,90

50,5-59

8,51

59-67,5

8,47

67,5-76

8,09

76-84,5

9,38

84,5-93

9,44

Общий итог

8,81


По полученным таблице и графику можно сделать вывод о следующем: усредненный опыт работы всех участников равен 8,81лет; наибольшее количество баллов по БТП набрали участники с усредненным опытом работы = 9,44 лет; наихудший результат показали участники с усредненным опытом работы = 8,09 лет.

 

Пол

Количество по полю Баллы по тренингу "Продажи"

Ж

76

М

84

Общий итог

160


Из полученных таблицы и графика можно вывести следующее: количество баллов по БТО у женщин равняется 76; количество БТП у мужчин равняется 84; общий средний БТП равен 160. Отсюда можно сделать вывод, что значение БТП не имеет прямой зависимости от пола участника.

Баллы по треннингу "Продажи"

Среднее по полю Средняя зарплата/месяц

42-50,5

7497,81

50,5-59

7485,98

59-67,5

7453,63

67,5-76

7436,61

76-84,5

7795,28

84,5-93

7633,22

Общий итог

7557,50


График БТП и з/п
По полученным из таблицы и графика данным можно предположить следующее: усредненная з/п = 7557,5; наибольшая усредненная з/п= 7795,28 приходится на участников, набравших от 76 до 84,5 БТП; наименьшая усредненная з/п= 7436,61 приходится на участников, набравших от 67,5 до 76 БТП.

 

             

 

Значения

 

Баллы по треннингу "Продажи"

Среднее по полю IQ

Среднее по полю EQ

42-50,5

132,7

86,5

50,5-59

132,2

101,2

59-67,5

119,8

118,3

67,5-76

136,3

134,5

76-84,5

134,1

151,6

84,5-93

121,6

168,0

Общий итог

130,0

126,5

График БТП IQ EQ

По полученным из таблицы и графика данным можно предположить следующее: среднее значение по EQ=126,5 среднее значение по IQ=130,0; наибольший усредненный уровень EQ имеют участники, набравшие от 84,5до 93 БТП; наименьший усредненный уровень EQ имеют участники, набравшие от 42 до 50,5 БТП; наибольший усредненный уровень IQ имеют участники, набравшие от 67,5 до 76 БТП; наименьший усредненный уровень IQ имеют участники, набравшие от 59 до 67,5 . Отсюда можно сделать вывод, что среднее значение по IQ не имеет прямой зависимости от EQ .

5. Сложные группировки между «БТП» и др.

 

 

 

Значения

 

Баллы по тренингу "Продажи"

 

Пол

Среднее по полю Опыт работы

Количество по полю Табельный номер

42-50,5

Ж

8,2

10

 

М

9,55

11

42-50,5 Итог

 

8,90

21

50,5-59

Ж

8,2

25

 

М

9

16

50,5-59 Итог

 

8,51

41

59-67,5

Ж

8,82

11

 

М

8

8

59-67,5 Итог

 

8,47

19

67,5-76

Ж

7,75

8

 

М

8,27

15

67,5-76 Итог

 

8,09

23

76-84,5

Ж

9,36

11

 

М

9,39

18

76-84,5 Итог

 

9,38

29

84,5-93

Ж

8,73

11

 

М

9,94

16

84,5-93 Итог

 

9,44

27

Общий итог

 

8,81

160


 

График БТП, пол, сред. опыт работы.

По полученным из таблицы и графика данным можно предположить следующее: наибольшее количество участников(41) набрали от 50,5 до 59 БТП; наименьшее количество участников(19) набрали от 59 до 67,5 БТО; усредненный опыт работы у мужчин и женщин в каждом интервале БТП практически равен; наибольшую опыт работы имеют участники(женщины),набравшие от 84,5до 93 БТП; наименьший усредненный опыт работы имеют участники(мужчины),набравшие от 59 до 67,5 БТП.

 

 

Значения

 

Баллы по тренингу "Продажи"

Баллы по тренингу "Новая техника"

Среднее по полю IQ

Количество

42-50,5

 

 

 

 

-4,5-4

145

1

 

4-12,5

141,8

5

 

12,5-21

141,75

4

 

21-29,5

126

5

 

29,5-38

122,6666667

6

42-50,5 Итог

 

132,7142857

21

50,5-59

 

 

 

 

-13--4,5

95

1

 

-4,5-4

136,5

2

 

4-12,5

128,3333333

3

 

12,5-21

125,6153846

13

 

21-29,5

133,2142857

14

 

29,5-38

150,5

6

 

38-46,5

133,5

2

50,5-59 Итог

 

132,2195122

41

59-67,5

 

 

 

 

-4,5-4

136

1

 

4-12,5

122,6666667

3

 

12,5-21

122,2

5

 

21-29,5

111,2857143

7

 

29,5-38

127,6666667

3

59-67,5 Итог

 

119,8421053

19

67,5-76

 

 

 

 

-13--4,5

170

1

 

-4,5-4

127

4

 

4-12,5

113,6666667

3

 

12,5-21

134,75

4

 

21-29,5

145,8

5

 

29,5-38

142,2

5

 

38-46,5

136

1

67,5-76 Итог

 

136,2608696

23

76-84,5

 

 

 

 

-13--4,5

104

1

 

-4,5-4

116,2

5

 

4-12,5

158,8333333

6

 

12,5-21

140,4285714

7

 

21-29,5

131

4

 

29,5-38

122,6

5

 

38-46,5

132

1

76-84,5 Итог

 

134,137931

29

84,5-93

 

 

 

 

-13--4,5

133

1

 

-4,5-4

115,3333333

3

 

4-12,5

102,5

4

 

12,5-21

142,8888889

9

 

21-29,5

115,5

6

 

29,5-38

101,5

2

 

38-46,5

106

2

84,5-93 Итог

 

121,5925926

27


 

Из данных таблицы и графика можно предположить следующее: наибольшее количество участников от 38 до 46,5 БТНТ входят в интервал БТП от 50,5 до 59; наименьшее количество участников от 29,5 до 38 БТНТ входят в интервал БТП от 59 до 67,5; наибольший усредненный IQ имеют участники БТП по БТНТ от 67,5 до 76; наибольшее количество участников имеют IQ=158,8 и входят в интервал БТНТ от  4 до 12,5;


 

 

 

             

А-2. Вариационный анализ признака "Баллы по тренингу Продажи"

Гистограмма, кумулята и огива распределения сотрудников по БТП.

Баллы по тренингу "Продажи"

число участников

42-50,5

21

50,5-59

41

59-67,5

19

67,5-76

23

76-84,5

29

84,5-93

27

Общий итог

160


 

Баллы по тренингу "Продажи"

Число участников

Данные для кумуляты

Данные для огивы

Отклонения от среднего

42

1

1

160

25,20

43

3

4

159

24,20

44

1

5

156

23,20

45

3

8

155

22,20

46

1

9

152

21,20

47

1

10

151

20,20

48

2

12

150

19,20

49

2

14

148

18,20

50

7

21

146

17,20

51

9

30

139

16,20

52

4

34

130

15,20

53

3

37

126

14,20

54

4

41

123

13,20

55

3

44

119

12,20

 

Диаграмма распределения вариационного ряда БТП.
Для расчёта Отклонение от среднего мы используем функцию ABSABS  возвращает модуль (абсолютную величину) числа.

 

2. Расчет показателей

Среднее значение

67,2

Мода

51

Медиана

67

Размах вариации

51

Среднее линейное отклонение

13

Среднее квадратическое отклонение

14,51

Дисперсия

210,49

Относительный размах вариации

0,76

Относительное линейное отклонение

0,1

Коэффициент вариации

0,22

Коэффициент асимметрии

0,1

Коэффициент эксцесса

-1,31

Минимум

42

Максимум

93

 

 

 

Оценка.

Анализ вышеприведенного графика позволяет примерно определить медианное значение, то есть значение изучаемого признака, приходящееся на середину ранжированной совокупности. В данном случае медиана =67.

            Среднее квадратическое отклонение показывает, что количество набранных баллов отклоняются от усредненного значения на 14,51.

Размах вариации в данном случае=51. Рассчитанная величина свидетельствует о значительном относительном уровне колеблемости баллов по тренингу. Кумулята и Огива необходимы для графического изображения вариационного ряда. При помощи Кумуляты (кривая сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Если при  графическом изображении вариационного ряда оси кумуляты поменять местами, то мы получим Огиву.

Анализ произведенных расчетов:

Простейшим из показателей данной группы является вариационный размах. Он равен 51 (в нашем случае). Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.

Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины. Среднее линейное отклонение составило 12,8. Именно на это значение отклоняется в среднем количество набранных баллов участниками, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,51. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения.

Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 210,49.

К относительным показателям вариации относят: относительный размах вариации (0,76), относительное линейное отклонение (0,1) и коэффициент вариации (0,22). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима. Исчисляется в процентах; в нашем случае относительный разброс случайной величины составляет 22%.

Относительное линейное отклонение показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 0,1.

Относительный размах вариации (0,76) отражает относительную колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака допустимый.

Среднее значение — числовая характеристика множества чисел, т.е. наших данных; — некоторое число, заключённое между наименьшим и наибольшим из их значений. В нашем случае среднее значение является обобщающим показателем, характеризующий типический уровень баллов по тренингу Продажи, который равен 67,2.

            Мода — значение во множестве наблюдений, которое встречается наиболее часто. В нашей совокупности, этим числом является 51. Иногда в совокупности встречается более чем одна мода. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило, если встречается более чем одна мода, значит набор данных не подчиняется нормальному распределению. Следовательно, мы можем утверждать, что наша совокупность данных подчиняется нормальному распределению.

 

Описание использованных функций при расчете показателей в пункте 1 и 2:

Среднее значение =СУММПРОИЗВ(БТП;Число участников)/60.

Мода возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Для  дискретного  ряда  мода  определяется  как  значение  признака,  которому соответствует наибольшая частота, для интервального ряда – по формуле : M 0 = X0+ (fM0-fM0-1)/(fM0-fM0+1)*l  , где Х0 – начальное значение модального интервала , fM0; fM0+1 -  частота  появления  признака  соответственно  в  интервале модальном, предшествующем модальному и следующем за модальным;  l  – длина интервала.  Находим с помощью функции Excel =МОДА (БТП).

Медиана — это число, которое является серединой множества чисел. Медиана  для  дискретного  ряда  определяется  как  значение  признака  центральной единицы ряда (если в ряду нечетное число единиц) или как полусумма значений двух центральных единиц (если в ряду четное число единиц). Для интервального ряда медиану определяют по формуле: М е = Х 0 + ((fi/2-fMe-1 )/ f Me )* lде  X0 начальное значение медианного интервала;  fMe-1 –  накопленная частота в интервале, предшествующем медианному; f Me – частота появления признака в медианном интервале; l– длина интервала. Находим с помощью функции Excel =МЕДИАНА (БТП).

Среднее линейное отклонение =СУММПРОИЗВ(Отклонение от среднего;Число участников)/160.

Среднее квадратическое отклонение - показывает степень отклонения. находим с помощью функции =СТАНДОТКЛОН (БТП).

Размах вариации представляет собой разницу между максимальным и минимальным значений признака: Хmax – Хmin. Размах вариации имеет один недостаток - он оценивает лишь границы варьирования признака и не отражает колебленность внутри этих границ. Этого недостатка лишена дисперсия, рассчитываемая как средний квадрат отклонений значений признака от их средней величины. Находится с помощью функции =ДИСПР (БТП).

Относительный размах вариации =Размах вариации/среднее значение и относительное линейное отклонение =Среднее линейное отклонение/среднее значение находим путем деления размаха вариации показателей на его среднее значение. Аналогично и относительное линейное отклонение.

Коэффициент асимметрии характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значенийнтральный момент третьего порядка.  Используем функцию =СКОС (БТП).

Коэффициент Эксцесса характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределениеЭКСЦЕСС (БТП).

Коэффициент вариации находится путем деления среднего квадратического отклонения на среднее значение показателей.

 

 

 

 

 


B-3. Проверка гипотезы о нормальном характере распределения признака БТП для уровня значимости 0,05.

В этом разделе необходимо дать краткую характеристику нормального распределения и проверить гипотезу о нормальном законе распределения по указанному в задании признаку. Для этого можно воспользоваться критерием согласия Пирсона или критерий χ 2 (Хи –квадрат).

Эту проверку можно осуществить двумя способами: с помощью вычислений и графически. Преимущества графического – наглядность.

1 способ. Проверка гипотезы о нормальном распределении исследуемого признака через критерий Пирсона.

Идея критерия Пирсона заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений, т.е. значений которые бы имели место в случае нормального характера распределения. Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.

      Нам понадобятся следующие данные:

n=

160

число интервалов=

 

6

max=

93

 

 

 

 

min=

42

длина интервала=

 

1

среднеквадрат.отклон.=

14,50820631

среднее=

 

 

67,2

матожидание=

67,2

средне квадратическое отклонение =

14,51

размах вариации=

51

Ширина интервала b=

 

8

интервал изменения=

8,5

 

 

 

 

 

Столбцы Баллы по тренингу "Продажи" (t) и Число участников (Эмпирические частоты) берём из предыдущих пунктов.

Для того чтобы найти теоретические частоты нам необходимо будет найти середины интервалов по формуле: число min+ширину интервала(b), далее рассчитываем теоретическое распределение через формулу: НОРМРАСП(середина интервала; среднее; стандартное отклонение; ложь). И наконец рассчитываем теоретические частоты по формуле: произведение теоретическое значение распределения, число строк, ширина интервала). Можно сделать и проще. рассчитать через функцию = НОРМРАСП. Формула будет выглядеть следующим образом:

=НОРМРАСП(Х(i);среднее; стандартное­_откл; интегральная)*b *n.  Где Х(i) это БТП. Как увидим ниже значения получились одинаковые.

 

 

 

 

 

 

 

2 сопособ:

Баллы по тернингу Продажи

Число участников (Эмпирические частоты)

Теоретические частоты

χ2

Середины интервалов

теоретическое значение распределения

 

теоретические частоты

42-49

14

12

0,30

46

0,009454476

 

12,101729

50-57

40

23

12,03

54

0,018177909

 

23,267724

58-65

24

33

2,46

62

0,025787004

 

33,007365

66-73

22

35

4,56

70

0,026990337

 

34,547632

74-81

23

27

0,51

78

0,020843287

 

26,679408

82-89

29

15

12,53

86

0,01187612

 

15,201434

90-97

8

6

0,41

94

0,004992677

 

6,3906263

Сумма

160

151

33

 

 

 

151,19592

   Таким образом, находим Теоретические частоты для каждого Х(i) из столбца БТП.

Далее необходимо найти χ2. Хи-квадрат статистика=(Наблюдаемая частота – Ожидаемая частота)^2/Ожидаемая частота.

Критерий χ2 применяется в двух случаях: 1. Для сопоставления эмпирического распределения признака с теоретическим. 2. Для сопоставления двух и более эмпирических распределений одного и того же признака друг с другом.

Вычисляем через функцию =СУММ () сумму столбца χ2. Получаем 33.

Используя функцию ХИ2ОБР для уровня значимости 0,05 и степени свободы (n-1, т.е. 51-1) 50 получаем =ХИ2ОБР(0,1;СЧЁТ(значения БТП)-1)=68.

       Если значение статистики «Хи-квадрат» больше критического значения, то это является свидетельством того, что наблюдаемые частоты значимо отличаются от тех, которые ожидаются. В этом случае следует отклонить нулевую гипотезу и принять альтернативную гипотезу, сделав вывод о том, что наблюдаемые выборочные проценты значимо отличаются от заданных опорных значений.

Если значение статистики «Хи-квадрат» меньше критического значения, то наблюдаемые значения не очень отличаются от значений, которые можно ожидать.  В этом случае следует принять нулевую гипотезу (как приемлемую возможность) и сделать вывод, что наблюдаемые выборочные проценты не имеет значимых отличий от заданных опорных значений.

   В нашем случае получается 33 меньше 68. Отсюда делаем вывод, что нет оснований отклонить гипотезу о нормальном распределении выборки по признаку Баллы по тренингу "Продажи".

 

2 способ. Теперь мы попробуем проделать тоже самое с помощью графического метода. Наиболее простой, но весьма приближенный метод оценки согласия результатов с тем или иным распределением – графический. По этому методу результаты  располагают в вариационном ряду. Затем для каждого результата xi рассчитывают накопленную частотность по формуле, где i – номер результата в вариационном ряду, n – объём выборки. Используя накопленные частности как значения функции распределения, для каждого W(i) находят соответствующие значения квантиля предполагаемого распределения. В частности, для нормального распределения находят квантили стандартного нормального распределения zi. Результаты наносят на график в координатах x – z. Поскольку предполагается, что значения xi являются квантилями того же вида распределения, что и zi, между значениями x и z должна быть линейная зависимость. Если нанесенные на график точки укладываются вдоль прямой линии лишь с небольшими отклонениями, считается, что результаты удовлетворительно описываются выбранным теоретическим распределением. При больших отклонениях от прямой экспериментальное распределение не соответствует выбранному теоретическому.

W (i)=i/n+1, где i – табельный номер; x – БТП; W=i/n+1; z=НОРМСТОБР(W(i)).

 

i

x

W

z

81

68,00

0,5031056

0,0077846

1

43,08

0,0062112

-2,4999136

82

68,12

0,5093168

0,0233558

2

43,53

0,0124224

-2,2438086

83

68,15

0,5155280

0,0389326

3

43,60

0,0186335

-2,0828261

84

69,57

0,5217391

0,0545189

4

43,69

0,0248447

-1,9626278

85

69,76

0,5279503

0,0701185

5

44,35

0,0310559

-1,8654968

86

70,14

0,5341615

0,0857351

6

44,79

0,0372671

-1,7833204

87

70,30

0,5403727

0,1013726

7

45,74

0,0434783

-1,7116753

88

70,54

0,5465839

0,1170350

8

46,06

0,0496894

-1,6478723

89

70,54

0,5527950

0,1327262

9

47,03

0,0559006

-1,5901489

90

70,68

0,5590062

0,1484501

10

48,74

0,0621118

-1,5372847

91

70,88

0,5652174

0,1642108

11

48,74

0,0683230

-1,4883980

92

71,16

0,5714286

0,1800124

12

48,84

0,0745342

-1,4428302

93

71,21

0,5776398

0,1958590

13

49,08

0,0807453

-1,4000756

94

71,68

0,5838509

0,2117551

14

49,70

0,0869565

-1,3597374

95

71,83

0,5900621

0,2277048

15

49,78

0,0931677

-1,3214979

96

71,84

0,5962733

0,2437126

16

49,85

0,0993789

-1,2850988

97

72,27

0,6024845

0,2597831

17

49,86

0,1055901

-1,2503270

98

72,42

0,6086957

0,2759211

18

50,40

0,1118012

-1,2170046

99

72,45

0,6149068

0,2921312

19

50,40

0,1180124

-1,1849813

100

72,63

0,6211180

0,3084184

20

50,80

0,1242236

-1,1541292

101

72,90

0,6273292

0,3247879

21

51,10

0,1304348

-1,1243382

102

72,90

0,6335404

0,3412449

22

51,75

0,1366460

-1,0955131

103

73,03

0,6397516

0,3577948

23

52,17

0,1428571

-1,0675705

104

73,14

0,6459627

0,3744433

24

52,20

0,1490683

-1,0404376

105

73,61

0,6521739

0,3911963

25

52,37

0,1552795

-1,0140498

106

73,77

0,6583851

0,4080597

26

53,08

0,1614907

-0,9883498

107

73,77

0,6645963

0,4250401

27

53,46

0,1677019

-0,9632866

108

73,93

0,6708075

0,4421439

28

53,66

0,1739130

-0,9388143

109

73,96

0,6770186

0,4593780

29

53,94

0,1801242

-0,9148918

110

73,99

0,6832298

0,4767497

30

54,05

0,1863354

-0,8914817

111

74,05

0,6894410

0,4942665

31

54,42

0,1925466

-0,8685503

112

74,14

0,6956522

0,5119362

32

54,79

0,1987578

-0,8460667

113

74,41

0,7018634

0,5297673

33

56,43

0,2049689

-0,8240029

114

74,62

0,7080745

0,5477684

34

56,70

0,2111801

-0,8023332

115

74,81

0,7142857

0,5659488

35

56,80

0,2173913

-0,7810338

116

74,92

0,7204969

0,5843183

36

57,50

0,2236025

-0,7600830

117

75,12

0,7267081

0,6028870

37

57,93

0,2298137

-0,7394606

118

75,45

0,7329193

0,6216660

38

58,46

0,2360248

-0,7191481

119

75,83

0,7391304

0,6406669

39

59,56

0,2422360

-0,6991280

120

75,88

0,7453416

0,6599019

40

59,63

0,2484472

-0,6793843

121

75,95

0,7515528

0,6793843

41

59,65

0,2546584

-0,6599019

122

76,08

0,7577640

0,6991280

42

60,27

0,2608696

-0,6406669

123

76,18

0,7639752

0,7191481

43

60,66

0,2670807

-0,6216660

124

76,24

0,7701863

0,7394606

44

60,80

0,2732919

-0,6028870

125

76,34

0,7763975

0,7600830

45

61,12

0,2795031

-0,5843183

126

76,83

0,7826087

0,7810338

46

61,36

0,2857143

-0,5659488

127

76,95

0,7888199

0,8023332

47

61,40

0,2919255

-0,5477684

128

76,99

0,7950311

0,8240029

48

61,49

0,2981366

-0,5297673

129

78,05

0,8012422

0,8460667

49

61,58

0,3043478

-0,5119362

130

78,06

0,8074534

0,8685503

50

61,72

0,3105590

-0,4942665

131

78,28

0,8136646

0,8914817

51

61,81

0,3167702

-0,4767497

132

78,36

0,8198758

0,9148918

52

62,50

0,3229814

-0,4593780

133

78,53

0,8260870

0,9388143

53

62,73

0,3291925

-0,4421439

134

79,05

0,8322981

0,9632866

54

62,81

0,3354037

-0,4250401

135

79,49

0,8385093

0,9883498

55

63,21

0,3416149

-0,4080597

136

79,53

0,8447205

1,0140498

56

63,45

0,3478261

-0,3911963

137

80,13

0,8509317

1,0404376

57

63,57

0,3540373

-0,3744433

138

81,55

0,8571429

1,0675705

58

63,57

0,3602484

-0,3577948

139

81,72

0,8633540

1,0955131

59

64,23

0,3664596

-0,3412449

140

83,17

0,8695652

1,1243382

60

64,38

0,3726708

-0,3247879

141

83,44

0,8757764

1,1541292

61

64,49

0,3788820

-0,3084184

142

83,67

0,8819876

1,1849813

62

64,62

0,3850932

-0,2921312

143

83,79

0,8881988

1,2170046

63

64,63

0,3913043

-0,2759211

144

84,44

0,8944099

1,2503270

64

65,05

0,3975155

-0,2597831

145

84,53

0,9006211

1,2850988

65

65,20

0,4037267

-0,2437126

146

84,60

0,9068323

1,3214979

66

65,21

0,4099379

-0,2277048

147

85,03

0,9130435

1,3597374

67

65,24

0,4161491

-0,2117551

148

85,59

0,9192547

1,4000756

68

65,42

0,4223602

-0,1958590

149

86,22

0,9254658

1,4428302

69

65,56

0,4285714

-0,1800124

150

86,46

0,9316770

1,4883980

70

65,64

0,4347826

-0,1642108

151

87,05

0,9378882

1,5372847

71

65,67

0,4409938

-0,1484501

152

87,23

0,9440994

1,5901489

72

65,92

0,4472050

-0,1327262

153

87,81

0,9503106

1,6478723

73

65,96

0,4534161

-0,1170350

154

88,10

0,9565217

1,7116753

74

66,40

0,4596273

-0,1013726

155

88,10

0,9627329

1,7833204

75

66,62

0,4658385

-0,0857351

156

88,47

0,9689441

1,8654968

76

66,66

0,4720497

-0,0701185

157

88,64

0,9751553

1,9626278

77

66,89

0,4782609

-0,0545189

158

89,07

0,9813665

2,0828261

78

67,47

0,4844720

-0,0389326

159

89,54

0,9875776

2,2438086

79

67,58

0,4906832

-0,0233558

160

94,82

0,9937888

2,4999136

80

67,59

0,4968944

-0,0077846




 

Строим диаграмму, где Х-БТП, У это z.

Добавляем линию тренда.

 

С-4. Корреляционный анализ между признаком БТП по всем представленным в наблюдении признакам.

КОРРЕЛ  Возвращает коэффициент корреляции меду интервалами ячеек массив1 и массив2. Коэффициент корреляции используется для определения наличия взаимосвязи между двумя свойствами.

Корреляция - это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению

математического ожидания другой.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

            Используя функции =КОРЕЛЛ(), рассчитаем коэффициент корреляции между признаками.

 

Баллы по тренингу "Продажи"

Баллы по тренингу "Сервисное обслживание"

Баллы по тренингу "Новая техника"

Возраст

Опыт работы

IQ

EQ

Средняя зарплата/месяц

Баллы по тренингу "Продажи"

1,00

-0,17

0,11

0,13

0,11

-0,07

1,00

0,13

Баллы по тренингу "Сервисное обслуживание"

-0,17

1,00

-0,79

-0,83

-0,79

0,04

-0,16

-0,76

Баллы по тренингу "Новая техника"

0,11

-0,79

1,00

0,97

1,00

-0,02

0,10

0,88

Возраст

0,13

-0,83

0,97

1,00

0,13

-0,04

0,12

0,91

Опыт работы

0,11

-0,79

1,00

0,97

1,00

-0,03

0,10

0,88

IQ

-0,07

0,04

-0,02

-0,04

-0,03

1,00

-0,07

-0,03

EQ

1,00

-0,16

0,10

0,12

0,10

-0,07

1,00

0,12

Средняя зарплата/месяц

0,13

-0,76

0,88

0,91

0,88

-0,03

0,12

1,00

 

Видно, что самая сильная связь между Баллы по тренингу "Продажи" и EQ.

Для определения тесноты связи необходимо провести корреляционный анализ.

Процедура корреляционного анализа включает:

- построение корреляционной решетки;

- построение поля корреляции;

- расчет показателей корреляции;

- анализ и оценку наличия, направления и тесноты корреляционной связи по

группировке, графику и расчетным показателям.

     Теперь построим график корреляционного поля между признаком БТП и остальными признаками.

В системе координата оси абсцисс откладываются значения факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимые через эти оси, обозначаются точкой. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

 
 


 


 

Видим, что у БТП и EQ имеется связь(0,5х+3,57).

С-5. Построить уравнение линейной регрессионной связи результативного признака с факторным признаком, наиболее тесно связанным с результативным.

Построим уравнение линейной регрессионной связи результативного признака с факторным признаком, наиболее тесно связанным с результативным.Факторный признак - EQ, результативный - "Баллы по тренингу Продажи".

Используя функцию ЛИНЕЙН получаем:

Коэффициенты уравнения регрессии

 

 

 

 

 

0,50

3,57

m,b

уравнение регрессии Yрегр=

0,5Х+3,57

 

0,0024

0,3169

sem,seb

160

 

 

 

 

0,9963

0,8868

r2,sey

 

 

 

 

 

42403,79

158

F,df

Подставляя вместо х нужные нам переменные(EQ) мы сможем прогнозировать значение(БТП)

33343,36

124,24

sspeг,ssocт

Здесь m и b, коэффициенты уравнения, которое мы и искали, т.е. зависимость между ЮТП и EQ описывается в виде Yрегр=0,5х+3,57.

Sspeг ( регрессионная сумма квадратов) равно сумме квадратов разностей между пронозными значениями и средней арифметической исходных значений(в нашем случае = 33343,36), а ssocт ( остаточная сумма квадратов) равно сумме квадратовв разностей между прогнозными и исходными значениями(в нашем примере равен 124,24). Их сумма равна ssper + ssoст = sstotal, т.е. общей сумме квадратов.

Коэффициент детерминированности r2показывает(0,9963), насколько хорошо уравнение, полученное с помощью реггрессионного анализа, объясняет взаимосвязь между переменными. Он равен  sspeг/(sspeг+ ssoст). Чем меньше остаточная сумма квадратов, тем больше значение коэффициента детерминированности r2. Суть в следующем – ssрег – сумма квадратов объясняемая регрессией, а ssoст – сумма квадратов, объясняемая случайными ошибками, поэтому r2 фактически показывает насколько Y объясняется X-ом, т.е. насколько количество баллов в тренингах Продажи, в нашем примере, объясняется значениями EQ. В нашем примере значение равно = 0,99, что является хорошим показателем, т.е. фактически 99% изменения Y ( БТП) можно объяснить изменением Х (EQ).

Параметры F и df используются при проверке  статистических гипотез. F-это статистика или наблюдаемое значение; dfстепени свободы.

Параметр sey является стандартной ошибкой оценки для Yрегр . Можно сказать, что sey является некоторым аналогом среднеквадратического отклонения для Y, только отклонение не около среднего, а около значений вычисленных по уравнению Yрегр=0,5х+3,57. Sey измеряет степень отличия реальных значений Y от оценочной (прогнозной) величины Yрегр. Т.е. показывает примерно, какую величину ошибки мы допускаем, когда используем вместо исходного значения Y значение Yрегр. Реальное значение Y в 95% случаев, скорее всего будет в диапазоне ± 2 sey

 

С-6. По уравнению связи рассчитать прогноз среднего значения результативного признака для значений факторного признака БТП равных 1,2*xmax; 1,3*xmax1,5*xmax , где xmax – максимальное выборочное значение факторного признака.

EQxmax=

178

 

 

Делаем прогноз среднего значения БТП, для  EQ=1,2*xmax= :

БТП=3,57+0,5*(178*1,2)=

111

 

 

Делаем прогноз среднего значения БТП, для EQ=1,3*xmax= :

БТП=3,57+0,5*(1,3*178)=

120

 

 

Делаем прогноз среднего значения БТП, для EQ=1,5*хmax= :

БТП=3,57+0,5*(1,5*178)=

138

 

 

m и b  это коэффициенты нашего уравнения, т.е. зависимость между количеством баллов по тренингу Продажи и уровня EQ описывается в виде Yрегр=0,5х+3,57. Т.е. мы можем строить прогнозы, подставляя под Х (1,2 *хмах; 1,3*хмах; 1Б5*хмах, где хмах – максимальное выборочное значение факторного признака, т.е. EQ). Интерпретация коэффициента m. Фактически это означает на какую величину меняется Yрегр при изменении Х на одну единицу. В данном случае это 0,5. Т.е. при изменении уровня EQ, количество баллов БТП будет меняться на 0,5.

 

С-7. Определить доверительные интервалы для прогнозных значений (уровень значимости 0,01).

Через инструмент Excel «Анализ данных» и средства «Регрессия», получаем следующие данные:

Регрессионная статистика

Множественный R

0,998142149

R-квадрат

0,99628775

Нормированный R-квадрат

0,996264255

Стандартная ошибка

0,886752357

Наблюдения

160

Дисперсионный анализ

 

 

 

 

 

 

 

 

 

df

SS

MS

F

Значимость F

 

 

 

Регрессия

1

33343,36

33343,3599

42403,79

6,4E-194

 

 

 

Остаток

158

124,2401

0,78632974

 

 

 

 

 

Итого

159

33467,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

3,565113142

0,316877

11,25079679

6,11E-22

2,939253

4,190973

2,9392529

4,190973

Переменная X 1

0,503166884

0,002443

205,9218012

6,4E-194

0,498341

0,507993

0,4983408

0,507993

Где y-БТП; x-EQ.

Рассчитаем сначала стандартную ошибку прогнозирования, затем доверительный интервал. Для этого нам понадобятся значения:

X среднее(СРЗНАЧ(EQ)=126

Значение t находим с помощью функции =СТЬЮДРАСПОБР(0,01;n-2)=3

Степень свободы = n-2, т.е. 160-2

 

Теперь рассчитаем стандартную ошибку для конкретного значения Х0.

Затем найдем доверительные интервалы для прогнозных средних значений будут с 99% уровнем доверительной вероятности.

для x0=1,2*Хmax, х0=1,3*Хmax, x0=1,5*xmax.

Тогда, для x0=1,2*178=

213,6

 

Станд.ошибка прогнозирования(=КОРЕНЬ(se^2/160+sb^2*(B120-Xsr)^2)

0,224

Интервал=

(110,43

111,65)

А, для x0=1,3*178=

231,4

 

Станд.ошибка прогнозирования (=КОРЕНЬ(Se^2/160+Sb^2*(B124-Xsr)^2)

0,266

Интервал=

(119,28

120,72)

Тогда, для x0=1,5*178=

267

 

Станд.ошибка прогнозирования(=КОРЕНЬ(Se^2/160+Sb^2*(B128-Xsr)^2)

0,350

Интервал

(137,0

138,86)

 

 

Оценка произведенных расчетов.

Любой прогнозируемый результат получаем с какой-то ошибкой . Ошибка прогнозирования, если упрощенно, то это разница между прогнозом и фактическим значением. Зная ошибку прогнозирования можно определиться с точностью прогноза. Чем выше точность, тем больше требуется времени. В нашем примере стандартные ошибки достаточно малы(0,22; 0,26; 0,35), соответственное мы можем достаточно точно прогнозировать значения БТП .

Доверительные интервалы для прогнозных средних значений будут с 99% уровнем доверительной вероятности.

для x0=1,2*Хmax=1,2*178=213,6 Интервал (Прогноз среднего значения БТП, для EQ= 1,2*Хmax – t* Станд.ошибка прогнозирования, для Х0; Прогноз среднего значения БТП, для EQ= 1,2*Хmax + t* Станд.ошибка прогнозирования, для Х0). Т.е.(110,43;11,65).

А для х0=1,3*Xmax=1,3*178=231,4

Интервал (Прогноз среднего значения БТП, для EQ=1,3*Xmax - t* Станд.ошибка прогнозирования, для Х0; Прогноз среднего значения БТП, для EQ=1,3*Xmax + t* Станд.ошибка прогнозирования, для Х0) Т.е.( 119,28;120,72).

А для х0=1,3*Xmax=1,3*178=231,4

Интервал (Прогноз среднего значения БТП, для EQ=1,5*Xmax - t* Станд.ошибка прогнозирования, для Х0; Прогноз среднего значения БТП, для EQ=1,5*Xmax + t* Станд.ошибка прогнозирования, для Х0) Т.е.(137,00;138,86).

Основываясь на данных наблюдений, мы определяем границы, т.е. наши интервалы, в которых с заданной степенью достоверности  лежит прогнозируемый параметр. Т.е. с 99% вероятностью прогнозные значения будут в этих интервалах.

 

C-8. Для пары признаков БТП и факторным признаком, наиболее тесно связанным с результативным рассчитать отдельно: эмпирическое корреляционное отношение (ЭКО), коэффициент детерминации

Сравнить значения ЭКО и коэффициента детерминации.

 

По формуле Стерджесса найдём количество интервалов для признака EQ, ширину интервала (через инструмент Описательная статистика). Среднее значение для БТП и EQ.

n=1+3,322*LOG(EQ)=8; h=( Хmax-Xmin)/160=12

EQ

 

 

Среднее

126,469

Стандартная ошибка

2,27528

Медиана

126

Мода

102

Стандартное отклонение

28,7802

Дисперсия выборки

828,301

Эксцесс

-1,3164

Асимметричность

0,09298

Интервал

100

Минимум

78

Максимум

178

Сумма

20235

Счет

160

Удобной формой изучения связи является корреляционная таблица. В этой таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.

Построим корреляционную решетку для пары признаков БТП и EQ. Корреляционная  решетка –  это  аналитическая  группировка  единиц  совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной  решетки  можно  сделать  предположение  о  наличии  и  направлении  связи,  а также предварительную оценку тесноты связи.

Корреляционная решетка

EQ

 

 

 

 

 

 

 

 

 

БТП

78-89

90-101

102-113

114-125

126-137

138-149

150-161

162-173

174-185

Общий итог

42-50,5

13

8

 

 

 

 

 

 

 

21

50,5-59

 

17

24

 

 

 

 

 

 

41

59-67,5

 

 

4

12

3

 

 

 

 

19

67,5-76

 

 

 

1

16

6

 

 

 

23

76-84,5

 

 

 

 

 

10

18

1

 

29

84,5-93

 

 

 

 

 

 

1

23

3

27

Общий итог

13

25

28

13

19

16

19

24

3

160

Теперь необходимо рассчитать коэффициент детерминации, корреляционное отношение.

 

 

 

 

 

EQ

 

 

 

 

 

 

 

 

 

 

 

 

БТП

78-89

90-101

102-113

114-125

126-137

138-149

150-161

162-173

174-185

Общий итог

средние значения интервалов

Групповые средние (EQ)

 

42-50,5

13

8

 

 

 

 

 

 

 

21

46,25

87,69048

197,37

50,5-59

 

17

24

 

 

 

 

 

 

41

54,75

100,939

167,02

59-67,5

 

 

4

12

3

 

 

 

 

19

63,25

115,9211

13,21

67,5-76

 

 

 

1

16

6

 

 

 

23

71,75

129,8913

1,68

76-84,5

 

 

 

 

 

10

18

1

 

29

80,25

146,0862

69,75

84,5-93

 

 

 

 

 

 

1

23

3

27

88,75

161,3148

204,90

Общий итог

13

25

28

13

19

16

19

24

3

160

 

 

653,94

Средние

83,5

94,5

105,5

116,5

127,5

138,5

149,5

160,5

171,5

 

 

 

 

Групповые средние (БТП)

46,25

52,03

55,96

63,90

70,41

77,06

80,70

88,40

88,75

 

 

 

 

 

35,66

35,96

22,09

0,88

1,22

9,73

21,63

67,39

8,71

203,27

 

 

 

Дисперсия = ДИСПР(БТП)=210,49

Факторная дисперсия для БТП=СУММ(Групповых средних БТП)=203,27

ЭКО= Факторная дисперсия/Дисперсия=0,97

ЭКО изменяется в переделах от нуля до единицы. Чем ближе его значение к единице, тем большая доля вариации падает на группировочный признак.

ЭКО меньше, чем коэффициент корреляции,т.е.(0,97<1), что говорит о линейной связи между признаками БТП и EQ. Подобные действия необходимы  для  принятия  эффективных  управленческих  решений,  что бы знать, в какой мере социально-экономические явления и процессы связаны между собой.

D-9. Множественный корреляционно-регрессионный анализ.

Провести множественный корреляционно-регрессионный анализ признака «БТП» со всеми возможными факторными (рассматриваем порядковые качественные признаки как количественные, номинальные, как категориальные переменные).Для удобства сократим таблицу.

Баллы по тренингу "Продажи"

Баллы по тренингу "Новая техника"

Баллы по тренингу "Сервисное обслуживание"

Кол-во жалоб от покупателей за год

Возраст

Опыт работы

Пол

IQ

EQ

Средняя зарплата/месяц

Средняя премия/месяц

Высшее

Высшее техническое

Наличие судимости

Годовой объем продаж

85

24

83

3

38

7

0

114

163

7064

1345

0

0

0

4679,798

76

38

63

4

23

5

1

132

145

6523

1478

0

0

1

3890,568

84

2

121

2

49

11

0

136

158

8305

1972

1

0

0

6291,815

93

13

110

1

47

10

1

128

178

7964

1330

0

0

0

5525,68

85

26

83

2

35

7

0

125

164

7675

1498

0

0

0

5149,423

84

13

104

3

41

9

1

154

158

7882

1739

0

0

1

5218,117

63

4

132

8

59

12

0

94

117

8935

1118

0

0

0

5637,52

58

29

92

7

34

8

0

133

107

7680

2193

1

1

1

4401,294

87

39

64

2

20

5

0

120

164

6919

1456

0

0

0

4222,165

80

19

111

4

48

10

0

144

152

8336

1857

1

0

0

5919,302

52

28

83

7

31

7

1

115

95

7437

985

0

0

1

3671,662

50

32

82

9

32

7

0

147

93

7123

1962

1

1

0

4061,944

72

33

72

5

28

6

1

109

136

6878

2230

1

1

0

4384,64

74

3

134

5

62

12

1

86

139

8652

1133

0

0

0

6085,767

49

34

73

8

27

6

0

95

91

6573

840

0

0

0

3546,152

57

15

122

9

49

11

0

118

109

7859

1247

0

0

0

5099,652

90

28

102

1

42

9

1

111

171

7442

2263

1

1

0

5203,433

78

3

113

3

48

10

0

153

146

7979

1566

0

0

0

5073,068

55

12

101

9

45

9

0

118

102

7693

1159

0

0

0

4626,472

74

19

103

4

42

9

0

166

142

7208

2612

1

1

0

4973,723

48

2

120

9

52

11

1

145

91

8557

1886

1

0

0

5828,041

Применяем «Регрессия» из «Анализа данных». В этом примере У - БТП, Х - все остальные признаки.

Регрессионная статистика

Множественный R

0,998385

R-квадрат

0,996772

Нормированный R-квадрат

0,99646

Стандартная ошибка

0,86315

Наблюдения

160

Дисперсионный анализ

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

14

33359,57088

2382,826491

3198,302709

6,5315E-173

Остаток

145

108,0291244

0,745028444

 

 

Итого

159

33467,6

 

 

 

 

Коэф-

фициенты

Стандартная ошибка

t-статистика

P-

Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

4,733749

1,940538044

2,439400425

0,01591896

0,898354417

8,569144244

0,898354417

8,569144244

Переменная X 1

-0,01766

0,01104373

-1,59889171

0,11202144

-0,03948521

0,00416975

-0,03948521

0,00416975

Переменная X 2

-0,00374

0,053841488

-0,06950520

0,94468325

-0,11015778

0,10267325

-0,11015778

0,102673258

Переменная X 3

-0,15237

0,06237696

-2,44278932

0,01577626

-0,27565930

-0,02908823

-0,27565930

-0,02908823

Переменная X 4

-0,04246

0,028923749

-1,46815167

0,14422896

-0,09963107

0,01470216

-0,09963107

0,01470216

Переменная X 5

0,143447

0,580552144

0,247087088

0,80519032

-1,00399087

1,29088475

-1,00399087

1,29088475

Переменная X 6

-0,23173

0,161064411

-1,43874224

0,15237861

-0,55006746

0,08660711

-0,55006746

0,08660711

Переменная X 7

0,001827

0,003007463

0,607392769

0,54454030

-0,00411741

0,00777084

-0,00411741

0,00777084

Переменная X 8

0,492635

0,007910321

62,27746252

1,5628E-106

0,47700032

0,50826918

0,47700032

0,50826918

Переменная X 9

0,000514

0,000245585

2,09208252

0,03817414

2,83952E-05

0,00099917

2,83952E-05

0,00099917

Переменная X 10

-0,00083

0,00054437

-1,533491115

0,12733390

-0,00191071

0,00024113

-0,00191071

0,00024113

Переменная X 11

0,114743

0,326430342

0,351507269

0,72571808

-0,53043372

0,75991899

-0,53043372

0,75991899

Переменная X 12

0,597639

0,327388612

1,825473636

0,06998723

-0,04943106

1,244709621

-0,049431063

1,244709621

Переменная X 13

0,28552

0,185592425

1,538422739

0,12612466

-0,08129631

0,65233556

-0,08129631

0,65233552

Переменная X 14

-0,00012

0,000256751

-0,45914156

0,64682006

-0,00062534

0,00038957

-0,00062534

0,00038957

Проанализировать корреляционную таблицу, p-значение и отбросить лишние факторные (X) признаки. В нашем примере отбросим все, кроме X3, X8, X9.

Баллы по тренингу "Продажи"

Баллы по тренингу "Сервисное обслуживание"

Опыт работы

EQ

85

83

7

163

76

63

5

145

84

121

11

158

93

110

10

178

85

83

7

164

84

104

9

158

63

132

12

117

58

92

8

107

87

64

5

164

80

111

10

152

52

83

7

95

50

82

7

93

72

72

6

136

74

134

12

139

49

73

6

91

57

122

11

109

90

102

9

171

78

113

10

146

55

101

9

102

74

103

9

142

48

120

11

91


 

Регрессионная статистика

Множественный R

0,998163

R-квадрат

0,99633

Нормированный R-квадрат

0,996259

Стандартная ошибка

0,887344

Наблюдения

160

Дисперсионный анализ

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

3

33344,76874

11114,92291

14116,34099

1,1096E-189

Остаток

156

122,8312617

0,787379882

 

 

Итого

159

33467,6

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

3,073519

0,692465675

4,438514106

1,70492E-05

1,705699894

4,441337441

1,705699894

4,441337441

Переменная X 1

0,019979

0,050360335

0,396721812

0,692114796

-0,079497096

0,119455183

-0,079497096

0,119455183

Переменная X 2

-0,16615

0,505533016

-0,328663289

0,74285098

-1,164723176

0,832422889

-1,164723176

0,832422889

Переменная X 3

0,50281

0,002459854

204,4065261

2,022E-191

0,497951287

0,507669125

0,497951287

0,507669125

        Отметим, что в данном случае БТП не зависит от БТНТ, поэтому уберем переменную X1 и оставим только признаки X7, X10.

Баллы по тренингу "Продажи"

Баллы по тренингу "Сервисное обслуживание"

Опыт работы

EQ

85

83

7

163

76

63

5

145

84

121

11

158

93

110

10

178

85

83

7

164

84

104

9

158

63

132

12

117

58

92

8

107

87

64

5

164

80

111

10

152

52

83

7

95

50

82

7

93

72

72

6

136

74

134

12

139

49

73

6

91

57

122

11

109

90

102

9

171

78

113

10

146

55

101

9

102

74

103

9

142

48

120

11

91

 

Регрессионная статистика

Множественный R

0,998162

R-квадрат

0,996327

Нормированный R-квадрат

0,996281

Стандартная ошибка

0,88482

Наблюдения

160

 

Дисперсионный анализ

 

 

 

 

 

df

SS

MS

F

Значимость F

Регрессия

2

33344,68369

16672,34184

21295,44551

7,101E-192

Остаток

157

122,9163141

0,782906459

 

 

Итого

159

33467,6

 

 

 

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

3,260535

0,393494265

8,286106471

4,87125E-14

2,483309779

4,037760966

2,483309779

4,037760966

Переменная X 1

0,003451

0,002653613

1,300330805

0,195393214

-0,001790813

0,008691964

-0,001790813

0,008691964

Переменная X 2

0,502843

0,002450873

205,1688499

1,1319E-192

0,498001777

0,507683651

0,498001777

0,507683651

Анализируя полученные данные, видим, что p-значение для X1 слишком велико и необходимо исключить ее из рассмотрения. Кажется, что нет смысла в этом примере использовать множественную регрессию для прогнозирования БТП. Возможно, необходимо перебрать другие, потенциальные  по влиянию на Y комбинации факторных признаков. Проанализировать определитель произведения матрицы факторных признаков, проанализировать коэффициенты частичной корреляции.

 

Е-10. Для пар признаков «Пол» и наличие судимости: коэффициент ассоциации и коэффициент контингенции.

Используются для измерения связи между двумя качественными признаками, состоящими только из двух групп.

Они необходим для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп. Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка ≥ 0.5 или Кк ≥ 0,3.

При построении критерия оценки тесноты связи атрибутивных признаков естественно потребовать, чтобы он изменялся в пределах от -1 до +1 (подобно коэффициенту корреляции), причем чтобы +1 соответствовал абсолютной положительной связанности, -1 - абсолютной отрицательной связи, а нулевое значение - независимости признаков.

Коэффициент контингенции Юла:

Легко видеть, что при независимости признаков , при абсолютной положительной связи , при абсолютной отрицательной связи .

Недостатком коэффициента Юла является то, что он не различает полной и абсолютной связанности признаков, давая для этих случаев +1 или -1, т.е. коэффициент Юла существенно завышает оценку связи признаков.

Указанного недостатка не имеет коэффициент ассоциации Пирсона

который при независимости признаков также равен нулю, а значения +1, -1 принимает только при абсолютной связанности признаков.

Количество по полю Высшее техническое

наличие судимости

 

 

a=

73

Пол

нет

да

Общий итог

b=

3

ж

73

3

76

c=

47

м

47

37

84

d=

37

Общий итог

120

40

160

Таблица сопряженности признаков. Атрибутивные признаки A и B являются независимыми.
Рассчитываем коэффициенты :

Коэффициент контингенции: = (a*d-b*c)/((a+b)*(b+d)*(a+c)*(c+d))^0,5=

0,462

Коэффициент ассоциации: =(a*d-b*c)/(a*d+b*c) =

0,9

Коэффициенты ассоциации и контингенции применяются для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп( пол, наличие судимости). Коэффициент ассоциации Пирсона измеряется от —1 до +1 и интер­претируется так: чем ближе коэффициент к 1, тем теснее связь, положительная или отрицательная. В нашем случае коэффициент ассоциации почти равен единицы(0,9), это свидетельствует о существенной связи между признаками. Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, т.к. 0,462<0,9.

Е-11. Для пар признаков «БТП» и «БТСО»  рассчитать: коэффициент Спирмена.

Коэффициент Спирмена rs не является параметрическим критерием в отличии от коэффициента Пирсона:

rs = 1 – (6∑d2/n(n2 – 1), где d — разница между значениями рангов для каждой единицы. Так же как и коэффициент Пирсона, значение rs изменяется от -1 до +1. Значимость коэффициента Спирмена может быть проверена таким же образом, что и значение коэффициента Пирсона.

БТП и БТСО. Используя функцию КОРРЕЛ рассчитаем коэффициент корреляции между рангами, который является искомым коэффициентом.

rs=

0,1383

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи. Справедливо утверждение, что в нашем случае коэффициент равен 0,138, что свидетельствует о слабой тесноты связи между признаками.

Е-12. Для пар признаков «БТСО и «БТНТ», рассчитать: коэффициент Кендалла.

Коэффициент Кендалла, как и коэффициент Спирмена, подсчитывается для признаков, измеренных по ранговой шкале, по формуле:

, где S+ - х-БТСО, у-S- .

 

P=СУММ(Совпадений)=2694

Q=СУММ(Инверсий)= 10026

Тогда τ=(P-Q)/(0,5*160*(160-1))=-0,58

Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.
Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен. коэффициент Кендалла дает более осторожную и, видимо, более объективную оценку степени связи двух признаков, чем коэффи­циент Спирмена. В нашем примере он равен -0,58 и, может быть, наиболее реально показывает тесноту связи.

 

Е-13 Для пары признаков БТП и БТСО рассчитать коэффициент Спирмена и коэффициент корреляции. Объяснить различия.

В пункте Е-11 мы нашли для пары признаков БТП и БТСО коэффициент Спиремена, который равен 0,138, а также рассчитали в пункте С-4 коэффициент корреляции равный -0,17. Теперь рассмотрим основные различия между этими коэффициентами.

Коэффициент корреляции рангов Спирмена, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин. В нашем случае баллы по Продажам и по Сервисному обслуживанию. В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего, чем 20 числа признаков – затруднителен.

Корреляция же предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).

Для получения адекватного результата по расчету коэффициента корреляции, необходимо, чтобы коррелируемые ряды были приближены к нормальному распределению (среднее и стандартное отклонение являются параметрами нормального распределения). Для формулы Спирмена это не актуально. Обязательным условием использования коэффициента Спирмена является равенство размаха переменных.

Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.
Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений.

 

G-16. Определить доверительный интервал для среднего генеральной совокупности по признаку БТП с уровнем значимости 0,01.

Доверительный интервал в статистике — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он накрывает данный параметр с заданной вероятностью.

Используем функцию ДОВЕРИТ().

Выборочное среднее

 

67,2

Объем выборки

 

=

160

Ширина доверительного интервала

3

Интервал = (выборочное среднее-ширина выб.интервала; выборочное среднее+ширина выб.интервала (64,25;70,15)

т.е. искомый доверительный интервал  64,25< Хср.ген <70,15. Итак ,с вероятностью 0,99 можно утверждать, что интервал (64,25; 70,15) содержит внутри себя среднее количество баллов по тренингу Продажи.

 

 

G-17.  Определить долю единиц генеральной совокупности, для которых значение признака БТП больше 90 с уровнем значимости 0.01.

Всего значений > 90

 

3

Доля

 

 

0,02

Ширина доверительного интервала для доли

0,01

 

t

 

 

2,61

=СЧЁТЕСЛИ(БТП;">90").

=Всего значений/n=3/160.

=КОРЕНЬ(Доля*(1-Доля)/160)= КОРЕНЬ(0,02*(1-0,02)/160).

 

=СТЬЮДРАСПОБР(0,01;159).

Доверительный интервал=( Доля - t *Ширину доверительного Интервала для доли;Доля+t *Ширину доверительного Интервала для доли)=(-0,009;0,047)

Сначала разберемся, что такое уровень значимости статистического критерия. Это ограничение сверху на вероятность ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она на самом деле верна). В нашем случае = 0.01.

Мы получаем характеристику генеральной совокупности по соответствующим показателям выборки, с условием, если БТП больше 90. Показатели выборочной доли или средней распространяется на генеральную совокупность с учётом ошибки выборки. С этими условиями можно утверждать, что в доверительный интервал от -0,009 до 0,047 входит доля генеральной совокупности признака БТП с уровнем значимости 0,01.

 

Вывод по всем пунктам проделанной работы:

 

А-1. Сводка и группировка данных, числовая статистика.

В результате статистического наблюдения обычно получают «сырой» материал, записи об отдельных единицах наблюдения. Так и в нашем случае материал непригоден для непосредственного использования ни для практических целей, ни для целей научного анализа. Возникает необходимость в специальной обработке статистических данных, т.е. в сводке материалов наблюдения. Т.е. мы проделали комплекс последовательных действий по обобщению конкретных признаков, образующих совокупность в целях выявления типических черт и закономерностей, присущих изучаемому явлению в целом.

 

А-2.Вариационный анализ БТП.

Первый этап вариационного анализа - это построение вариационного ряда. Так как изучаемый нами признак относится к непрерывному виду, то необходимо строить интервальный ряд. По формуле Стержесса определяем длину интервала. Полученное значение k=8. Следовательно, будет 6 интервалов. Минимальное значение признака равно =42,а максимальное =93. Такие границы, несомненно, способствуют легкости восприятия и наглядности распределения. Кроме того, эти границы достаточно близки к соответственно минимальному и максимальному значению признака.

Кумулята и Огива необходимы для графического изображения вариационного ряда. При помощи Кумуляты (кривая сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Если при  графическом изображении вариационного ряда оси кумуляты поменять местами, то мы получим Огиву.

 

В-3.Проверка гипотез.

Исключительно важную роль при обработке результатов наблюдений играет проверка нормальности распределения.

Эта задача представляет собой частный случай более общей проблемы, заключающейся в подборе теоретической функции распределения, в некотором смысле наилучшим образом согласующейся с опытными данными.

Наша выборка достаточно большого объема и равна 160. Для удобства ее обработки разделим интервал от наименьшего до наибольшего из значений вариант на s равных частей и будем считать, что значения вариант, попавших в каждый интервал, приближенно равны числу, задающему середину интервала. Подсчитав число вариант, попавших в каждый интервал, составим так называемую сгруппированную выборку, где хi значения середин интервалов, а пi число вариант, попавших в i-й интервал (эмпирические частоты).
По полученным данным можно вычислить выборочное среднее(67,2) и выборочное среднее квадратическое отклонение(14,51). Тогда можно найти количество чисел из выборки объема n, которое должно оказаться в каждом интервале при этом предположении (то есть теоретические частоты).

Наша цель сравнить эмпирические и теоретические частоты, которые, конечно, отличаются друг от друга, и выяснить, являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении исследуемой случайной величины, или они настолько велики, что противоречат этой гипотезе. Для этого используется критерий в виде случайной величины. Смысл ее очевиден: суммируются части, которые квадраты отклонений эмпирических частот от теоретических составляют от соответствующих теоретических частот. Имея ввиду, что уровень значимости у нас равен 0,05 и степени свободы = 10, мы получаем 35 а это больше искомой величины хи-квадрат. Отсюда делаем вывод, что нет оснований отклонить гипотезу о нормальном распределении выборки по признаку БТП.

 

С-4. Корреляционный анализ между БТП и остальными признаками.

Корреляционным анализом называется совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками. В нашем случае мы находили зависимость между БТП и остальными признаками, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению  математического ожидания другой.

Графически взаимосвязь двух признаков изображали с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи. Такую тесную связь между признаками нам показала пара БТП и EQ. Это можно увидеть на графике, точки тесно сгруппированы.

 

С-5. Построить уравнение линейной регрессионной связи между БТП и EQ(в моем случае).

Находим коэффициенты уравнения регрессии с помощью функции ЛИНЕЙН. Статистический смысл уравнения: с увеличением х на 1 ед., y возрастает в среднем на а ед.

 

C-6. По уравнению связи рассчитать прогноз среднего значения результативного признака.

По полученному уравнению мы проводим прогноз количества баллов по Продажам, в зависимости от изменения максимального значения EQ в 1,2; 1,3 и в 1,5 раз. Мы получили прогнозные значения, с помощью которых сможем сделать прогноз относительно того, чему будут равняться баллы по тренингу Продажи при выборе определенного уровня EQ.

 

C-7. Определить доверительные интервалы для прогнозных значений, если уровень значимости 0,01.

Через инструмент Excel «Анализ данных» и средства «Регрессия», получаем данные(коэффициенты, стандартные ошибки, t-статистика, р-значение и т.д.), где у-БТП, а х-EQ.

Для построения доверительного интервала мы рассчитали х-среднее, значение t, стандартную ошибку прогнозирования, используя коэффициенты уравнения регрессии. Учитывая, что уровень значимости у нас 0,01, то с 99% вероятностью прогнозные значения будут в этих интервалах.

 

С-8. Рассчитать ЭКО и коэффициент детерминации для признаков БТП и EQ.

Сначала по формуле Стерджесса найдём количество интервалов для признака EQ, ширину интервала (через инструмент Описательная статистика). Среднее значение для БТП и EQ.

n=1+3,322*LOG(EQ)=8; h=( Хmax-Xmin)/160=12. Удобной формой изучения связи является корреляционная таблица. В этой таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного.

Построим корреляционную решетку для пары признаков БТП и EQ. Корреляционная  решетка –  это  аналитическая  группировка  единиц  совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной  решетки  можно  сделать  предположение  о  наличии  и  направлении  связи,  а также предварительную оценку тесноты связи.

Далее мы рассчитываем коэффициент детерминации, корреляционное отношение. ЭКО изменяется в переделах от нуля до единицы. Чем ближе его значение к единице, тем большая доля вариации падает на группировочный признак.

ЭКО меньше, чем коэффициент корреляции,т.е.(0,97<1), что говорит о линейной связи между признаками БТП и EQ. Подобные действия необходимы  для  принятия  эффективных  управленческих  решений,  что бы знать, в какой мере социально-экономические явления и процессы связаны между собой.

 

D-9.Множественный корреляционно-регрессионный анализ.

Множественный корреляцонно-регрессионный анализ это метод установления зависимости одной переменной от двух или более независимых переменных. В нашем случае большинство независимых переменных являются категориальными, в этом случае лучше использовать дисперсионный анализ. Что мы и делаем через анализ данных, Excel рассчитывает нам дисперсионный анализ. Как показано в работе, анализ на основе множественной регрессии основан на использовании более чем одной независимой переменной в уравнении регрессии. Это усложняет анализ, делая его многомерным. Однако регрессионная модель более полно отражает действительность, так как в реальности исследуемый параметр, как правило, зависит от множества факторов. Все, что касается множественной регрессии, концептуально является идентичным парной регрессии, за исключением того, что используется более чем одна переменная. Под этим углом зрения слегка изменяются терминология и статистические расчеты.

 

Е-10.Рассчитать коэффициент ассоциации и коэффициент контингенции для пары признаков Пол и Судимость.

Используются для измерения связи между двумя качественными признаками, состоящими только из двух групп.Они необходим для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп. Коэффициент контингенции(0,462) всегда меньше коэффициента ассоциации(0,9). Коэффициент контингенции и ассоциации определяют связь двух качественных признаков. Различия между этими коэффициентами в том, что коэффициент контингенции в отличие от коэффициента ассоциации завышает оценку связи признаков.

 

Е-11.Рассчитать коэффициент Спирмена для БТП и БТНТ.

При использовании коэффициента ранговой корреляции Спирмена мы условно оценивают тесноту связи между признаками БТП и БТНТ, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи. Справедливо утверждение, что в нашем случае коэффициент равен 0,138, что свидетельствует о слабой тесноты связи между признаками. Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции. Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности.

 

Е-12.Рассчитать коэффициент Кендалла для БТП и БТНТ.

Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен. коэффициент Кендалла дает более осторожную и, видимо, более объективную оценку степени связи двух признаков, чем коэффи­циент Спирмена. В нашем примере он равен -0,58 и, может быть, наиболее реально показывает тесноту связи.

 

Е-13.Рассчитать коэффициент Спирмена и коэффициент корреляции для пар признаков БТП и БТНТ. Объяснить различия.

В пункте Е-11 мы нашли для пары признаков БТП и БТСО коэффициент Спиремена, который равен 0,138, а также рассчитали в пункте С-4 коэффициент корреляции равный -0,17. Теперь рассмотрим основные различия между этими коэффициентами.

Коэффициент корреляции рангов Спирмена, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин. В нашем случае баллы по Продажам и по Сервисному обслуживанию. В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего, чем 20 числа признаков – затруднителен.

Корреляция же предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу. Пропорциональность означает просто линейную зависимость. Корреляция высокая, если на графике зависимость "можно представить" прямой линией (с положительным или отрицательным углом наклона).

Для получения адекватного результата по расчету коэффициента корреляции, необходимо, чтобы коррелируемые ряды были приближены к нормальному распределению (среднее и стандартное отклонение являются параметрами нормального распределения). Для формулы Спирмена это не актуально. Обязательным условием использования коэффициента Спирмена является равенство размаха переменных.

Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции. Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений.

 

G-16. Определить доверительный интервал для среднего генеральной совокупности по признаку БТП с уровнем значимости 0,01.

Доверительный интервал в статистике — это интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он накрывает данный параметр с заданной вероятностью. Использую функцию ДОВЕРИТ нашли интервал. Искомый доверительный интервал  64,25< Хср.ген <70,15. Итак ,с вероятностью 0,99 можно утверждать, что интервал (64,25; 70,15) содержит внутри себя среднее количество баллов по тренингу Продажи.

 

G-17. Определить долю единиц генеральной совокупности, для которых значение признака БТП больше 90 с уровнем значимости 0.01.

Соотношение численности выборочной и генеральной совокупностей называется долей выборки в генеральной совокупности.

Сначала разберемся, что такое уровень значимости статистического критерия. Это ограничение сверху на вероятность ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она на самом деле верна). В нашем случае = 0.01.

Мы получаем характеристику генеральной совокупности по соответствующим показателям выборки, с условием, если БТП больше 90. Показатели выборочной доли или средней распространяется на генеральную совокупность с учётом ошибки выборки. С этими условиями можно утверждать, что в доверительный интервал от -0,009 до 0,047 входит доля генеральной совокупности признака БТП с уровнем значимости 0,01.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы:

 

Джини К. Средние величины. – М.: Статистика, 1970.

Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. – Кн.1. –М.: Финансы и статистика, 1986.

Теория статистики: Учебник/Под. Ред. Проф. Р.А. Шмойловой. – 3-е изд., перераб. – М.: Финансы и статистика, 1999.

Книга–справочник Популярный экономико-статистический словарь-справочник/Под. Ред. И.И.Елисеевой. – М.: Финансы и статистика, 1993.

Российский статистический ежегодник: Официальное издание. – М.: Госкомстат РФ, 1998.

 

 

Информация о работе Статистика