Таблица критических значений пирсона

Значения - критерия Пирсона

Число

степеней

свободы

K=(m11)∙(m2-1)

Уровень значимости

Число

степеней

свободы

Уровень значимости

0,10

0,05

0,01

0,10

0,05

0,01

1

2

3

4

1

2

3

4

1

2,71

3,84

6,63

21

29,62

32,67

38,93

2

4,61

5,99

9,21

22

30,81

33,92

40,29

3

6,25

7,81

11,34

23

32,01

35,17

41,64

4

7,78

9,49

13,28

24

33,20

36,42

42,98

5

9,24

11,07

15,09

25

34,38

37,65

44,31

6

10,64

12,59

16,81

26

35,56

38,89

45,64

7

12,02

14,07

18,48

27

36,74

40,11

46,96

8

13,36

15,51

20,09

28

37,92

41,34

48,28

9

14,68

16,92

21,67

29

39,09

42,56

49,59

10

15,99

18,31

23,21

30

40,26

43,77

50,89

11

17,28

19,68

24,72

40

51,80

55,76

63,69

12

18,55

21,03

26,22

50

63,17

67,50

76,15

13

19,81

22,36

27,69

60

74,40

79,08

88,38

14

21,06

23,68

29,14

70

85,53

90,53

100,42

15

22,31

25,00

30,58

80

96,58

101,88

112,33

16

23,54

26,30

32,00

90

107,56

113,14

124,12

17

24,77

27,59

33,41

100

118,50

124,34

135,81

18

25,99

28,87

34,81

19

27,20

30,14

36,19

20

28,41

31,41

37,57

Таблица 3

Значения f-критерия Фишера при уровне значимости 0,05

v2 v1

1

2

3

v2 v1

1

2

3

1

161,00

200,00

216,00

18

4,41

3,55

3,16

2

18,51

19,00

19,16

19

4,38

3,52

3,13

3

10,13

9,55

9,28

20

4,35

3,49

3,10

4

7,71

6,94

6,59

21

4,32

3,47

3,07

5

6,61

5,79

5,41

22

4,30

3,44

3,05

6

5,99

5,14

4,76

23

4,28

3,42

3,03

7

5,59

4,74

4,35

24

4,26

3,40

3,01

8

5,32

4,46

4,07

25

4,24

3,88

2,99

9

5,12

4,26

3,86

26

4,22

3,37

2,98

10

4,96

4,10

3,71

27

4,21

3,35

2,96

11

4,84

3,98

3,59

28

4,20

3,34

2,95

12

4,75

3,88

3,49

29

4,18

3,33

2,93

13

4,67

3,80

3,41

30

4,17

3,32

2,92

14

4,60

3,74

3,34

40

4,08

3,23

2,84

15

4,54

3,68

3,29

50

4,03

3,18

2,79

16

4,49

3,63

3,24

60

4,00

3,15

2,76

17

4,45

3,59

3,20

100

3,94

3,09

2,70

V1=m-1; V2=n-m; n-число наблюдений; m-число признаков.

Таблица 4

StudFiles.ru

Значения критерия Пирсона (критерия )

  1. Число степеней свободы,

    1

    3,84

    6,63

    2

    5,99

    9,21

    3

    7,81

    11,3

    4

    9,49

    13,3

    5

    11,1

    15,1

    6

    12,6

    16,8

    7

    14,1

    18,5

    8

    15,5

    20,1

    9

    16,9

    21,7

    10

    18,3

    23,2

  2. Табличные значения критерия Вилкоксона

N

6

0

7

2

8

4

0

9

6

2

10

8

3

11

11

5

12

14

7

13

17

10

14

21

13

15

25

16

16

30

20

17

35

23

18

40

28

19

46

32

20

52

38

21

59

43

22

66

49

23

73

55

24

81

61

25

89

68

  1. Таблицы вероятностей, связанных со значениями критерия Манна-Уитни .

Таблицы вероятностей, связанных со значениями критерия Манна-Уитни. Для экспе­римен­таль­но­го­ значения критерия (меньшего из двух значений) и объемов выборокнаходят вероятность того, что обе группы принадлежат одной генеральной совокупности. Таким образом, низкое значение вероятности, например, Р

  1. Таблица 1.

    U

    1

    2

    3

    0

    0,250

    0,100

    0,050

    1

    0,500

    0,200

    0,100

    2

    0,750

    0,400

    0,200

    3

    0,600

    0,350

    4

    0,500

    5

    0,650

  2. Таблица 2.

U

1

2

3

4

0

0.200

0.067

0.028

0.014

1

0.400

0.133

0.057

0.029

2

0.600

0.267

0.114

0.057

3

0.400

0.200

0.100

4

0.600

0.314

0.171

5

0.429

0.243

6

0.571

0.343

7

0.443

8

0.557

  1. Таблица 3.

    U

    1

    2

    3

    4

    5

    0

    0.167

    0.047

    0.018

    0.008

    0.004

    1

    0.333

    0.095

    0.036

    0.016

    0.008

    2

    0.500

    0.190

    0.071

    0.032

    0.016

    3

    0.667

    0.286

    0.125

    0.056

    0.028

    4

    0.429

    0.196

    0.095

    0.048

    5

    0.571

    0.286

    0.143

    0.075

    6

    0.393

    0.206

    0.111

    7

    0.500

    0.278

    0.155

    8

    0.607

    0.365

    0.210

    9

    0.452

    0.274

    10

    0.548

    0.345

    11

    0.421

    12

    0.500

  2. Таблица 4.

    U

    1

    2

    3

    4

    5

    6

    0

    0.143

    0.036

    0.012

    0.005

    0.002

    0.001

    1

    0.286

    0.071

    0.024

    0.010

    0.004

    0.002

    2

    0.428

    0.143

    0.048

    0.019

    0.009

    0.004

    3

    0.571

    0.214

    0.083

    0.033

    0.015

    0.008

    4

    0.321

    0.131

    0.057

    0.026

    0.013

    5

    0.429

    0.190

    0.086

    0.041

    0.021

    6

    0.571

    0.274

    0.129

    0.063

    0.032

    7

    0.357

    0.176

    0.089

    0.047

    8

    0.452

    0.238

    0.12

    0.066

    9

    0.548

    0.305

    0.165

    0.090

    10

    0.381

    0.214

    0.120

    11

    0.457

    0.268

    0.155

    12

    0.545

    0.331

    0.197

    13

    0.396

    0.242

    14

    0.465

    0.294

    15

    0.535

    0.350

    16

    0.409

    17

    0.469

    18

    0.531

  3. Таблица 5.

U

1

2

3

4

5

6

7

0

0.125

0.028

0.008

0.003

0.001

0.001

0.000

1

0.250

0.056

0.017

0.006

0.003

0.001

0.001

2

0.375

0.111

0.033

0.012

005

0.002

0.001

3

0.500

0.167

0.058

0.021

0.009

0.004

0.002

4

0.625

0.250

0.092

0.036

0.015

0.007

0.003

5

0.333

0.133

0.055

0.024

0.011

0.006

6

0.444

0.192

0.082

0.037

0.017

0.009

7

0.556

0.258

0.115

0.053

0.026

0.013

8

0.333

0.158

0.074

0.037

0.019

9

0.417

0.206

0.101

0.051

0.027

10

0.500

0.264

0.134

0.069

0.036

11

0.583

0.324

0.172

0.090

0.049

12

0.394

0.216

0.117

0.064

13

0.464

0.265

0.147

0.082

14

0.538

0.319

0.183

0.104

15

0.378

0.223

0.130

16

0.438

0.267

0.159

17

0.500

0.314

0.191

18

0.562

0.365

0.228

19

0.418

0.267

20

0.473

0.310

21

0.527

0.355

22

0.402

23

0.451

24

0.500

25

0.549

    1. Таблица 6.

      U

      1

      2

      3

      4

      5

      6

      7

      8

      0

      0.111

      0.022

      0.006

      0.002

      0.001

      0.000

      0.000

      0.000

      1

      0.222

      0.044

      0.012

      0.004

      0.002

      0.001

      0.000

      0.000

      2

      0.333

      0.089

      0.024

      0.008

      0.003

      0.001

      0.001

      0.000

      3

      0.444

      0.133

      0.042

      0.014

      0.005

      0.002

      0.001

      0.001

      4

      0.556

      0.200

      0.067

      0.024

      0.009

      0.004

      0.002

      0.001

      5

      0.267

      0.097

      0.036

      0.015

      0.006

      0.003

      0.001

      6

      0.356

      0.139

      0.055

      0.023

      0.010

      0.005

      0.002

      7

      0.444

      0.188

      0.077

      0.033

      0.015

      0.007

      0.003

      8

      0.556

      0.248

      0.107

      0.047

      0.021

      0.010

      0.005

      9

      0.315

      0.141

      0.064

      0.030

      0.014

      0.007

      10

      0.387

      0.184

      0.085

      0.041

      0.020

      0.010

      11

      0.461

      0.230

      0.111

      0.054

      0.027

      0.014

      12

      0.539

      0.285

      0.142

      0.071

      0.036

      0.019

      13

      0.341

      0.177

      0.091

      0.047

      0.025

      14

      0.404

      0.217

      0.114

      0.060

      0.032

      15

      0.467

      0.262

      0.141

      0.076

      0.041

      16

      0.533

      0.311

      0.172

      0.095

      0.052

      17

      0.362

      0.207

      0.116

      0.065

      18

      0.416

      0.245

      0.140

      0.080

      19

      0.472

      0.286

      0.168

      0.097

      20

      0.528

      0.331

      0.198

      0.117

      21

      0.377

      0.232

      0.139

      22

      0.426

      0.268

      0.164

      23

      0.475

      0.306

      0.191

      24

      0.525

      0.347

      0.221

      25

      0.389

      0.253

      26

      0.433

      0.287

      27

      0.478

      0.323

      28

      0.522

      0.360

  1. Таблица критических значений критерия Манна-Уитни для уровня значимости  .

Если , то различие между выборками достоверно для, то есть нулевую гипотезу следует от­вергнуть.

N2

N1

 0

9

10

11

12

13

14

15

16

17

18

19

1

2

0

0

0

1

1

1

1

1

2

2

2

2

3

2

3

3

4

4

5

5

6

6

7

7

8

4

4

5

6

7

8

9

10

11

11

12

13

13

5

7

8

9

11

12

13

14

15

17

18

19

20

6

10

11

13

14

16

17

19

21

22

24

25

27

7

12

14

16

18

20

22

24

26

28

30

32

34

8

15

17

19

22

24

26

29

31

34

36

38

41

9

17

20

23

26

28

31

34

37

39

42

45

48

10

20

23

26

29

33

36

39

42

45

48

52

55

11

23

26

30

33

37

40

44

47

51

55

58

62

12

26

29

33

37

41

45

49

53

57

61

65

69

13

28

33

37

41

45

50

54

59

63

67

72

76

14

31

36

40

45

50

55

59

64

67

74

78

83

15

34

39

44

49

54

59

64

70

75

80

85

90

16

37

42

47

53

59

64

70

75

81

86

92

98

17

39

45

51

57

63

67

75

81

87

93

99

105

18

42

48

55

61

67

74

80

86

93

99

106

112

19

45

52

58

65

72

78

85

92

99

106

113

119

20

48

55

62

69

76

83

90

98

105

112

119

127

StudFiles.ru

9.2. Коэффициент корреляции Пирсона

Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в 1886 г. Однако точную формулу для подсчета коэффициента корреляции разработал его ученик Карл Пирсон. Знакомство с корреляционным анализом мы начнем с изучения этого коэффициента. Сам коэффициент характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. Поэтому он называется также коэффициентом линейной корреляции Пирсона.

Величина коэффициента линейной корреляции Пирсона не может превышать +1 и быть меньше чем -1. Эти два числа +1 и -1 – являются границами для коэффициента корреляции. Когда при расчете получается величина большая +1 или меньшая -1 – следовательно, произошла ошибка в вычислениях.

Если коэффициент корреляции по модулю оказывается близким к 1, то это соответствует высокому уровню связи между переменными. Так, в частности, при корреляции переменной величины с самой собой величина коэффициента корреляции будет равна +1. Подобная связь характеризует прямо пропорциональную зависимость. Если же значения переменной X будут распложены в порядке возрастания, а те же значения (обозначенные теперь уже как переменная Y) будут распола­гаться в порядке убывания, то в этом случае корреляция между переменными X и Y будет равна точно –1. Такая величина коэффициента корреляции характеризует обратно пропорциональную зависимость.

Знак коэффициента корреляции очень важен для интерпретации полученной связи. Подчеркнем еще раз, что если знак коэффициента линейной корреляции – плюс, то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.

Если же получен знак минус, то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости. При этом выбор переменной, которой приписывается характер (тенденция) возрастания – произволен. Это может быть как переменная X, так и переменная Y. Однако если психолог будет считать, что увеличивается переменная X, то переменная Y будет соответственно уменьшаться, и наоборот. Эти положения очень важно четко усвоить для правильной интерпретации полученной корреляционной зависимости.

В общем виде формула для подсчета коэффициента корреляции такова:

, (9.1)

где xi – значения, принимаемые переменной X;

yi – значения, принимаемые переменной Y;

Мх– средняя по X;

Му– средняя по Y.

Расчет коэффициента корреляции Пирсона предполагает, что переменные X и Y распределены нормально.

Формула (9.1) предполагает, что из каждого значения xi переменной X, должно вычитаться ее среднее значение Мх. Это неудобно. Поэтому для расчета коэффициента корреляции используют не эту формулу, а ее аналог, получаемый простыми преобразованиями:

, (9.2)

где и,

или модификацию этой формулы:

. (9.3)

Согласно формулам (9.2) и (9.3) необходимо подсчитать сумму каждой переменной, сумму квадратов каждой переменной и сумму последовательных произведений переменных друг на друга. Подчеркнем, что сумма квадратов – не равняется квадрату суммы!

Обратим внимание еще вот на какое обстоятельство. В формуле (9.1) встречается величины

. (9.4)

При делении на n (число значений переменной X или Y) она называется ковариацией. Выражение (9.4) может быть подсчитано только в тех случаях, когда число значений переменной X равно числу значений переменной Y и равно n. Формула (9.4) предполагает также, что при расчете коэффициентов корреляции нельзя произвольно переставлять элементы в коррелируемых столбцах, как это делается, например, в случае расчета по критерию S Джонкира.

Используя формулу (9.3), решим следующую задачу.

Пример 9.1.20 школьникам были даны тесты на наглядно-образное и вербальное мышление. Измерялось среднее время решения заданий теста в секундах. Психолога интересует вопрос: существует ли взаимосвязь между временем решения этих задач? Переменная X обозначает среднее время решения наглядно-образных, а переменная Y – среднее время решения вербальных заданий тестов.

Решение. Прежде всего, сформулируем гипотезы.

Н0: связь между временем решения наглядно-образных и вербальных задач отсутствует.

Н1: связь между временем решения наглядно-образных и вербальных задач присутствует.

Представим исходные данные в виде таблицы, в которой введены дополнительные столб­цы, необходимые для расчета по формуле (9.3). В таблице 9.1 даны индивидуальные значения переменных X и Y, построчные произведения переменных Х и Y, квадраты переменных всех индивидуальных значений переменных X и Y, а также суммы всех вышеперечисленных величин.

Таблица 9.1

испытуемых

X

Y

X∙Y

X∙X

Y∙Y

Среднее время решения

наглядно-образных

заданий

Среднее время решения

вербальных

заданий

1

19

17

323

361

289

2

32

7

224

1024

49

3

33

17

561

1089

289

4

44

28

1232

1936

784

5

28

27

756

784

729

6

35

31

1085

1225

961

7

39

20

780

1521

400

8

39

17

663

1521

289

9

44

35

1540

1936

1225

10

44

43

1892

1936

1849

11

24

10

240

576

100

12

37

28

1036

1369

784

13

29

13

377

841

169

14

40

43

1720

1600

1849

15

42

45

1890

1764

2025

16

32

24

768

1024

5760

17

48

45

2160

2304

2025

18

42

26

1092

1764

679

19

33

16

528

1089

256

20

47

26

1222

2209

676

Сумма

731

518

20089

27873

16000

Рассчитываем эмпирическую величину коэффициента корреляции по формуле (9.3).

.

Определяем критические значения для полученного коэффициента корреляции по таблице критических значений коэффициента корреляции Пирсона (таблица 1 приложения 1). Особо отметим, что в этой таблице величины критических значений коэффициентов линейной корреляции Пирсона даны по абсолютной величине. Следовательно, при получении как положительного, так и отрицательного коэффициента корреляции по формуле (9.3) оценка уровня значимости этого коэффициента проводится по той же таблице без учета знака, а знак добавляется для дальнейшей интерпретации характера связи между переменными X и Y.

При нахождении критических значений для вычисленного коэффициента линейной корреляции Пирсона гэмп число степеней свободы рассчитывается как k = n – 2. В нашем случае к = 20, поэтому n – 2 = 20 – 2 = 18. В первом столбце таблицы 1 приложения 1 в строке, обозначенной числом 18, находим:

Строим соответствующую ось значимости.

Ввиду того, что величина расчетного коэффициента корреляции попала в зону значимости – гипотеза Н0 отвергается и принимается гипотеза Н1. Иными словами, связь между временем решения наглядно-образных и вербальных задач статистически значима на 1% уровне и положительна. Полученная прямо пропорциональная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных, и наоборот.

Для применения коэффициента корреляции Пирсона необходимо соблюдать следующие условия:

  1. Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.

  2. Распределения переменных Х и Y должны быть близки к нормальному.

  3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.

  4. Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществ­ляется при числе степеней свободы k = n – 2.

StudFiles.ru

Расчет корреляционной связи между двумя признаками

У участников психологического эксперимента был измерен уровень соперничества (по тесту Томаса) и стиль общения (по тесту Журавлева). Полученные данные занесены в таблицу 6. Можно ли утверждать, что люди, склонные к соперничеству, предпочитают деспотичный стиль общения? Можно ли утверждать, что люди, склонные к соперничеству, предпочитают коллегиальный или либеральный стиль общения?

Цель задания. Освоить метод корреляционного анализа и построить график двумерного рассеяния.

Таблица 6 – Результаты психологического исследования уровня

соперничества (по тесту Тамаса) и стиля общения (по тесту Журавлева)

№ респон-дента Возраст Уровень соперничества Деспотический стиль общения Коллегиальный стиль общения Либеральный стиль общения

Решение. Для решения задачи перенесём данные из таблицы 6 в лист рабочей книги MS Excel.

Построим графики двумерного рассеяния случайной величины (X, Y), где X – уровень соперничества, Y – стиль общения: деспотический (рис.8), коллегиальный (рис.9), и либеральный (рис.10).

Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону.

Коэффициент корреляции – параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле:

Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая линейная зависимость). При значении 0 линейной зависимости между двумя выборками нет.

Рисунок 8 – График двумерного рассеяния

(X – уровень соперничества, Y – деспотический стиль общения)

В MS Excel для вычисления парных коэффициентов линейной корреляции Пирсона можно пользоваться статистической функцией КОРРЕЛ (массив1; массив2), где массив1 – ссылка на диапазон ячеек первой выборки (X); массив2 – ссылка на диапазон ячеек второй выборки (Y).

Рисунок 9 – График двумерного рассеяния

(X – уровень соперничества, Y – коллегиальный стиль общения)

Рисунок 10 – График двумерного рассеяния

(X – уровень соперничества, Y – либеральный стиль общения)

Рассчитаем коэффициент корреляции по указанной выше формуле. Результаты представлены в таблице 7.

Таблица 7 – Коэффициент корреляции Пирсона

между стилем общения и уровнем соперничества

Стиль общения Коэффициент корреляции Пирсона стиля общения с уровнем соперничества
Деспотический 0,993
Коллегиальный -0,053
Либеральный -0,441

Так как количество респондентов N=21, то число степеней свободы . Из таблицы «Значения (критические) коэффициента корреляции Пирсона r для различный уровней зависимости и различного числа степеней свободы (размеров выборок)» (см. приложения) найдем критические значения коэффициента корреляции и выпишем их в таблицу 8.

Таблица 8 – Критические значения коэффициента корреляции Пирсона (для N=21)

Число степеней свободы df=(N-2) Уровень значимости для двустороннего критерия Пирсона
0,050 0,250 0,010 0,005 0,0005
0,369 0,430 0,050 0,549 0,6652

Таким образом, из таблицы 7 и 8 видно, что между уровнями соперничества и деспотическим стилем общения наблюдается линейная корреляция по Пирсону на уровне значимости 0,0005, т.е. с надежностью 99,95% можно утверждать, что люди, склонные к соперничеству предпочитают деспотичный стиль общения. Гипотеза о корреляции коллегиального стиля общения с уровнем соперничества и корреляции либерального стиля общения с уровнем соперничества на уровне значимости 0,05 статистически не подтвердились.

4. Анализ классификации при сравнении эмпирического и теоретического распределений

Проведено исследование, в котором проводилось сравнение частот проявления агрессии в группе студентов-психологов и остальных студентов вуза в ходе проведения тренинга преодоления агрессивного поведения. Средняя частота проявления агрессии по вузу составила K %, а в данном случае из N студентов-психологов ярко выраженное агрессивное поведение проявили L студентов. Можно ли на этом основании сделать вывод о том, что среди студентов психологов проявление агрессии наблюдается реже, чем в целом по вузу? (Значения N, K, L см. в таблице 9).

Таблица 9 – Значения N, K, L согласно варианту контрольной работы

N K L

Цель задания. Освоение метода анализа классификации при сравнении эмпирического и теоретического распределений в случае двух градаций (применяется биноминальный критерий) и в случае более двух градаций (применяется критерий χ2).

Решение. Сформулируем гипотезы:

- H0: Частота проявления агрессии в группе студентов-психологов не превышает средней частоты проявления агрессии в целом по вузу;

- H1: Частота проявления агрессии в группе студентов-психологов превышает среднюю частота проявления агрессии в целом по вузу.

Будем считать, что вероятность проявления агрессии у студентов совпадает с частотой его проявления у всех студентов вуза . Используя данные таблицы 9, найдем эмпирическую частоту проявления агрессии у студентов-психологов по формуле . Таким образом, получаем

Так как: 1) fэмп > fтеор, 2) , 3) объем выборки удовлетворяет условию: , то применим биномиальный критерий. Согласно биномиальному критерию подтверждается гипотеза H1: fэмпдостоверно выше fтеор.

Таким образом, частота проявления агрессии в исследуемой группе студентов-психологов превышает среднюю частота проявления агрессии в целом по вузу.

5. Анализ таблиц сопряженности двух номинативных признаков

Цель задания: освоение метода анализа таблиц сопряженности.

Для каждого абитуриента репрезентативной выборки определены а) пол; б) одна из четырех возможных новых гуманитарных специальностей открытых только в данном вузе (таблица 10).

Таблица 10 – Таблица сопряженности двух номинативных признаков
согласно варианту контрольной работы

Y – специальность
Всего
Х - пол Муж. (1)
Жен. (2)
Всего:

Проверить гипотезу о зависимости выбора специальности от пола.

Решение. Сформулируем гипотезы:

- H0: Распределение абитуриентов по заданным гуманитарным специальностям открытым в вузе не зависит от их пола;

- H1: Распределение абитуриентов по заданным гуманитарным специальностям открытым в вузе зависит от их пола.

Для проверки гипотезы H0 будем использовать метод, получивший название c2 (хи-квадрат) критерий.

где – фактическая частота в i-ой строке, j-ом столбце таблицы сопряженности;

– ожидаемая частота в i-ой строке, j-ом столбце таблицы сопряженности;

r = число строк в таблице сопряженности;

c = число столбцов в таблице сопряженности.

Найдем фактические частоты, которые находятся делением значения, записанного в соответствующей ячейке таблицы на общее число наблюдений (число в правом нижнем углу таблицы). Результаты запишем в таблицу 11.

Таблица 11 – Таблица фактических частот заданных номинативных признаков

Y – специальность
Всего
Х - пол Муж. (1)
Жен. (2)
Всего:

Теперь найдем ожидаемые частоты, которые находятся делением произведения двух соответствующих этой клетки сумм, записанных по краям таблицы, на сумму всех наблюдаемых частот. Результаты запишем в таблицу 12.

Таблица 12 – Таблица ожидаемых частот заданных номинативных признаков

Y - специальность
Всего
Х - пол Муж. (1)
Жен. (2)
Всего:

Вычисленную величину c2 сравним со стандартными значениями. Если она превышает то или иное стандартное значение, исходная гипотеза о независимости признаков отвергается на соответствующем уровне значимости. Для этого найдем число степеней свободы. В случае, когда по каждому признаку подразделяют не менее трёх градаций, число степеней свободы находят по формуле: n = (r - 1) + (c -1), где r - число градаций в первой классификации, c - во второй классификации. Если же одна из классификаций содержит только две градации, то n = (c – 1), где с – число градаций в более дробной классификации.

Таблица 13 – Стандартные значения распределения c2

Число степеней свободы Уровень значимости
0,01 0,025 0,05 0,95 0,975 0,99
9,2 7,4 0,103 0,051 0,02
11,3 9,4 7,8 0,352 0,216 0,115
13,3 11,1 9,5 0,711 0,484 0,297
15,1 12,8 11,1 1,15 0,831 0,554

Так как число степеней свободы здесь равно n = 4 – 1 = 3 фактическая величина = 2,48 меньше представленных в таблице критических значений для уровней значимости 0,01; 0,025 и 0,05, следовательно гипотеза Н0 о независимости распределения абитуриентов по заданным гуманитарным специальностям открытым в данном вузе от пола отвергается, а принимается гипотеза Н1.

Таким образом, рассматриваемое в задание распределение абитуриентов по заданным гуманитарным специальностям, открытым в данном вузе статистически значимо зависит от пола абитуриентов.

6. Анализ последовательности (критерий серий)

Цель задания: освоение метода анализа последовательности с помощью критерия серий.

Исследуется динамика научения в игровом задании. Исследователь предполагает частые повторы проигрышей в начале и выигрышей – в конце последовательности игр (проверяется направленная гипотеза). Игроком сыграно N партий, из них проиграно M, выиграно L, число серий W. К концу последовательности игр наблюдается преобладании выигрышей. Проверить гипотезу с применением Z-критерия серий.

Таблица 1 – Значение числа партий, выигрышей, проигрышей и серий

N M L W

Решение. Сформулируем гипотезы:

- H0: Выигрыши и проигрыши случайны;

- H1: В последовательности выигрышей и проигрышей существует значимая статистическая зависимость – число выигрыше в конце последовательности преобладает перед числом проигрышей (направленная гипотеза).

Для проверки гипотезы H0 будем использовать метод, получивший название критерий серий для одной выборки. Критерий серий позволяет с определенной долей вероятности ответить на вопрос, существует ли зависимость в последовательности выигрышей и проигрышей.

Уровень значимости выберем 0,05.

Последовательность может оказаться неслучайной, если в ней слишком мало или слишком много серий. Поэтому из таблицы критических значений критерия серий находим два критических значения: Rверх=21, Rнижн = 9, – верхнюю и нижнюю границу соответственно. Если W больше либо равно верхней границы или меньше либо равно нижней границы, то гипотезе H0 отклоняется. Так как число серий W=8, заданное в условии задачи, меньше Rнижн=9 то гипотеза H0 о случайности выигрышей и проигрышей не подтвердилась.

Таким образом, в последовательности выигрышей и проигрышей существует значимая (на уровне значимости 0,05) статистическая зависимость – число выигрыше в конце последовательности партий преобладает перед числом проигрышей. Следовательно, можно сделать вывод о статистически значимой динамике научения в игровом задании.

studopedia.ru

Квантили распределения хи-квадрат

Кванти́ли распределе́ния хи-квадра́т — числовые характеристики, широко используемые в задачах математической статистики таких как построение доверительных интервалов, проверка статистических гипотез и непараметрическое оценивание.

Квантиль хи-квадрат — это число (величина хи-квадрат), при котором функция распределения хи-квадрат равна заданной (затребованной) вероятности а.

Равенство функции распределения хи-квадрат вероятности а означает, что с вероятностью а будут наблюдаться значения хи-квадрат, не большие, чем найденный (определенный согласно функции распределения) квантиль хи-квадрат. Таким образом, найти квантиль означает разграничить распределения хи-квадрат согласно заданной вероятности а.

Определение

Пусть F n {\displaystyle F_{n}}  — функция распределения хи-квадрат χ 2 ( n ) {\displaystyle \chi ^{2}(n)} с n {\displaystyle n} степенями свободы, и α ∈ [ 0 , 1 ] {\displaystyle \alpha \in [0,1]} . Тогда α {\displaystyle \alpha } -квантилью этого распределения называется число χ α , n 2 {\displaystyle \chi _{\alpha ,n}^{2}} такое, что

F n ( χ α , n 2 ) = α {\displaystyle F_{n}\left(\chi _{\alpha ,n}^{2}\right)=\alpha } .

Замечания

  • Прямо из определения следует, что случайная величина, имеющая распределение хи-квадрат с n {\displaystyle n} степенями свободы, не превышает значение χ α , n 2 {\displaystyle \chi _{\alpha ,n}^{2}} с вероятностью α {\displaystyle \alpha } и превышает его с вероятностью 1 − α {\displaystyle 1-\alpha } .
  • Функция F n {\displaystyle F_{n}} строго возрастает для любого n ∈ N {\displaystyle n\in \mathbb {N} } . Следовательно, определена её обратная функция F n − 1 {\displaystyle F_{n}^{-1}} , и
F n − 1 ( α ) = χ α , n 2 {\displaystyle F_{n}^{-1}(\alpha )=\chi _{\alpha ,n}^{2}} .
  • Функция F n − 1 {\displaystyle F_{n}^{-1}} не имеет простого представления. Однако, возможно вычислить её значения численно.

Аппроксимация квантилей

Для получения приближенных значений квантилей распределения хи-квадрат χ α , n 2 {\displaystyle \chi _{\alpha ,n}^{2}} существуют аппроксимации.

  • Аппроксимация Корниша-Фишера[1]

χ α , n 2 = n + A n + B + C n + D n + E n n {\displaystyle \chi _{\alpha ,n}^{2}=n+A{\sqrt {n}}+B+{\frac {C}{\sqrt {n}}}+{\frac {D}{n}}+{\frac {E}{n{\sqrt {n}}}}} ,

где:

A = d 2 {\displaystyle A=d{\sqrt {2}}} ,

B = 2 3 ( d 2 − 1 ) {\displaystyle B={\frac {2}{3}}\left({{d}^{2}}-1\right)}

C = d ⋅ d 2 − 7 9 2 {\displaystyle C=d\cdot {\frac {{{d}^{2}}-7}{9{\sqrt {2}}}}}

D = − 6 d 4 + 14 d 2 − 32 405 {\displaystyle D=-{\frac {6{{d}^{4}}+14{{d}^{2}}-32}{405}}}

E = d ⋅ 9 d 4 + 256 d 2 − 433 4860 2 {\displaystyle E=d\cdot {\frac {9{{d}^{4}}+256{{d}^{2}}-433}{4860{\sqrt {2}}}}}

d = 2.0637 ⋅ ( ln ⁡ 1 1 − α − 0.16 ) 0.4274 − 1.5774 {\displaystyle d=2.0637\cdot {{\left(\ln {\frac {1}{1-\alpha }}-0.16\right)}^{0.4274}}-1.5774} при 0.5 ≤ α ≤ 0.999 {\displaystyle 0.5\leq \alpha \leq 0.999}

d = − 2.0637 ⋅ ( ln ⁡ 1 α − 0.16 ) 0.4274 + 1.5774 {\displaystyle d=-2.0637\cdot {{\left(\ln {\frac {1}{\alpha }}-0.16\right)}^{0.4274}}+1.5774} при 0.001 ≤ α 0.5 {\displaystyle 0.001\leq \alpha ,

где d определяется аналогично, а коэффициенты a, b,c приведены в таблице

a b c
1.0000886 -0.2237368 -0.01513904
0.4713941 0.02607083 -0.008986007
0.0001348028 0.01128186 0.02277679
-0.008553069 -0.01153761 -0.01323293
0.00312558 0.005169654 -0.006950356
-0.0008426812 0.00253001 0.001060438
0.00009780499 -0.001450117 0.001565326

Таблица квантилей

Нижеприведённая таблица получена с помощью функции chi2inv пакета MATLAB.

Также квантили можно получить с помощью других программных средств:

  • пакет LibreOffice, электронная таблица Calc, функция CHIINV.
  • библиотека scipy для языка python, функция scipy.stats.distributions.chi2.ppf
  • встроенная функция в электронной таблице Excel : ХИ2ОБР или ХИ2.ОБР
  • библиотека MathNet для .Net и Mono, метод MathNet.Numerics.Distributions.ChiSquared.InvCDF(n,a)

Чтобы получить значение χ α , n 2 {\displaystyle \chi _{\alpha ,n}^{2}} , необходимо найти строку, соответствующую нужному n {\displaystyle n} , и колонку, соответствующую нужному α {\displaystyle \alpha } . Искомое число находится в таблице на их пересечении.
Например:

χ 0.025 , 10 2 = 20.483 {\displaystyle \chi _{0.025,10}^{2}=20.483} ; χ 0.975 , 10 2 = 3.247 {\displaystyle \chi _{0.975,10}^{2}=3.247} . Квантили χ α , n 2 {\displaystyle \chi _{\alpha ,n}^{2}} 0,01 0,025 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,975 0,99 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
6,6349 5,0239 3,8415 2,7055 1,6424 1,0742 0,7083 0,4549 0,275 0,1485 0,0642 0,0158 0,0039 0,001 0,0002
9,2103 7,3778 5,9915 4,6052 3,2189 2,4079 1,8326 1,3863 1,0217 0,7133 0,4463 0,2107 0,1026 0,0506 0,0201
11,345 9,3484 7,8147 6,2514 4,6416 3,6649 2,9462 2,366 1,8692 1,4237 1,0052 0,5844 0,3518 0,2158 0,1148
13,277 11,143 9,4877 7,7794 5,9886 4,8784 4,0446 3,3567 2,7528 2,1947 1,6488 1,0636 0,7107 0,4844 0,2971
15,086 12,833 11,07 9,2364 7,2893 6,0644 5,1319 4,3515 3,6555 2,9999 2,3425 1,6103 1,1455 0,8312 0,5543
16,812 14,449 12,592 10,645 8,5581 7,2311 6,2108 5,3481 4,5702 3,8276 3,0701 2,2041 1,6354 1,2373 0,8721
18,475 16,013 14,067 12,017 9,8032 8,3834 7,2832 6,3458 5,4932 4,6713 3,8223 2,8331 2,1673 1,6899 1,239
20,09 17,535 15,507 13,362 11,03 9,5245 8,3505 7,3441 6,4226 5,5274 4,5936 3,4895 2,7326 2,1797 1,6465
21,666 19,023 16,919 14,684 12,242 10,656 9,4136 8,3428 7,357 6,3933 5,3801 4,1682 3,3251 2,7004 2,0879
23,209 20,483 18,307 15,987 13,442 11,781 10,473 9,3418 8,2955 7,2672 6,1791 4,8652 3,9403 3,247 2,5582
24,725 21,92 19,675 17,275 14,631 12,899 11,53 10,341 9,2373 8,1479 6,9887 5,5778 4,5748 3,8157 3,0535
26,217 23,337 21,026 18,549 15,812 14,011 12,584 11,34 10,182 9,0343 7,8073 6,3038 5,226 4,4038 3,5706
27,688 24,736 22,362 19,812 16,985 15,119 13,636 12,34 11,129 9,9257 8,6339 7,0415 5,8919 5,0088 4,1069
29,141 26,119 23,685 21,064 18,151 16,222 14,685 13,339 12,078 10,821 9,4673 7,7895 6,5706 5,6287 4,6604
30,578 27,488 24,996 22,307 19,311 17,322 15,733 14,339 13,03 11,721 10,307 8,5468 7,2609 6,2621 5,2293
32 28,845 26,296 23,542 20,465 18,418 16,78 15,338 13,983 12,624 11,152 9,3122 7,9616 6,9077 5,8122
33,409 30,191 27,587 24,769 21,615 19,511 17,824 16,338 14,937 13,531 12,002 10,085 8,6718 7,5642 6,4078
34,805 31,526 28,869 25,989 22,76 20,601 18,868 17,338 15,893 14,44 12,857 10,865 9,3905 8,2307 7,0149
36,191 32,852 30,144 27,204 23,9 21,689 19,91 18,338 16,85 15,352 13,716 11,651 10,117 8,9065 7,6327
37,566 34,17 31,41 28,412 25,038 22,775 20,951 19,337 17,809 16,266 14,578 12,443 10,851 9,5908 8,2604
38,932 35,479 32,671 29,615 26,171 23,858 21,991 20,337 18,768 17,182 15,445 13,24 11,591 10,283 8,8972
40,289 36,781 33,924 30,813 27,301 24,939 23,031 21,337 19,729 18,101 16,314 14,041 12,338 10,982 9,5425
41,638 38,076 35,172 32,007 28,429 26,018 24,069 22,337 20,69 19,021 17,187 14,848 13,091 11,689 10,196
42,98 39,364 36,415 33,196 29,553 27,096 25,106 23,337 21,652 19,943 18,062 15,659 13,848 12,401 10,856
44,314 40,646 37,652 34,382 30,675 28,172 26,143 24,337 22,616 20,867 18,94 16,473 14,611 13,12 11,524
45,642 41,923 38,885 35,563 31,795 29,246 27,179 25,336 23,579 21,792 19,82 17,292 15,379 13,844 12,198
46,963 43,195 40,113 36,741 32,912 30,319 28,214 26,336 24,544 22,719 20,703 18,114 16,151 14,573 12,879
48,278 44,461 41,337 37,916 34,027 31,391 29,249 27,336 25,509 23,647 21,588 18,939 16,928 15,308 13,565
49,588 45,722 42,557 39,087 35,139 32,461 30,283 28,336 26,475 24,577 22,475 19,768 17,708 16,047 14,256
50,892 46,979 43,773 40,256 36,25 33,53 31,316 29,336 27,442 25,508 23,364 20,599 18,493 16,791 14,953
52,191 48,232 44,985 41,422 37,359 34,598 32,349 30,336 28,409 26,44 24,255 21,434 19,281 17,539 15,655
53,486 49,48 46,194 42,585 38,466 35,665 33,381 31,336 29,376 27,373 25,148 22,271 20,072 18,291 16,362
54,776 50,725 47,4 43,745 39,572 36,731 34,413 32,336 30,344 28,307 26,042 23,11 20,867 19,047 17,074
56,061 51,966 48,602 44,903 40,676 37,795 35,444 33,336 31,313 29,242 26,938 23,952 21,664 19,806 17,789
57,342 53,203 49,802 46,059 41,778 38,859 36,475 34,336 32,282 30,178 27,836 24,797 22,465 20,569 18,509
58,619 54,437 50,998 47,212 42,879 39,922 37,505 35,336 33,252 31,115 28,735 25,643 23,269 21,336 19,233
59,893 55,668 52,192 48,363 43,978 40,984 38,535 36,336 34,222 32,053 29,635 26,492 24,075 22,106 19,96
61,162 56,896 53,384 49,513 45,076 42,045 39,564 37,335 35,192 32,992 30,537 27,343 24,884 22,878 20,691
62,428 58,12 54,572 50,66 46,173 43,105 40,593 38,335 36,163 33,932 31,441 28,196 25,695 23,654 21,426
63,691 59,342 55,758 51,805 47,269 44,165 41,622 39,335 37,134 34,872 32,345 29,051 26,509 24,433 22,164
64,95 60,561 56,942 52,949 48,363 45,224 42,651 40,335 38,105 35,813 33,251 29,907 27,326 25,215 22,906
66,206 61,777 58,124 54,09 49,456 46,282 43,679 41,335 39,077 36,755 34,157 30,765 28,144 25,999 23,65
67,459 62,99 59,304 55,23 50,548 47,339 44,706 42,335 40,05 37,698 35,065 31,625 28,965 26,785 24,398
68,71 64,201 60,481 56,369 51,639 48,396 45,734 43,335 41,022 38,641 35,974 32,487 29,787 27,575 25,148
69,957 65,41 61,656 57,505 52,729 49,452 46,761 44,335 41,995 39,585 36,884 33,35 30,612 28,366 25,901
71,201 66,617 62,83 58,641 53,818 50,507 47,787 45,335 42,968 40,529 37,795 34,215 31,439 29,16 26,657
72,443 67,821 64,001 59,774 54,906 51,562 48,814 46,335 43,942 41,474 38,708 35,081 32,268 29,956 27,416
73,683 69,023 65,171 60,907 55,993 52,616 49,84 47,335 44,915 42,42 39,621 35,949 33,098 30,755 28,177
74,919 70,222 66,339 62,038 57,079 53,67 50,866 48,335 45,889 43,366 40,534 36,818 33,93 31,555 28,941
76,154 71,42 67,505 63,167 58,164 54,723 51,892 49,335 46,864 44,313 41,449 37,689 34,764 32,357 29,707

ru.wikipedia.org

Читайте также