Определить достоверность коэффициента ранговой корреляции

1-й способ. Определить ошибку (m ρху) коэффициента ранговой корреляции и оценить достоверность его с помощью критерия t:

 = 0,16

Полученный критерий t = 5,75 соответствует вероятности безошибочного прогноза ρ больше 95 %:

ρху = - 0,92; m ρху = ± 0,16; t = 5,75; ρ> 95%.

 

2-й способ. По таблице "Стандартных коэффициентов корреляции": при числе степеней свободы (n - 2) = 5 - 2 = 3 наш расчетный коэффициент корреляции ρху= - 0,92 больше табличного 0,878 и меньше 0,934, что соответствует вероятности безошибочного прогноза больше 95% и меньше 98%. Это позволяет считать полученный коэффициент ранговой корреляции достоверным.

Вывод. С вероятностью безошибочного прогноза (р) больше 95% установлено, что чем больше стаж работы, тем меньше частота травм (связь обратная, сильная, достоверная корреляционная: ρху = - 0,92, ρ > 95%.

 

Задача 2 - эталон

на применение метода квадратов (метод Пирсона).

Задание: вычислить коэффициент корреляции, определить направление и силу связи между количеством кальция в воде и жесткостью воды, если известны следующие данные (табл. 1). Оценить достоверность связи. Сделать вывод.

Таблица 1

Жесткость воды (в градусах) Количество кальция в воде (в мг/л)
4 8 11 27 34 37 28 56 77 191 241 262

 

Обоснование выбора метода. Для решения задачи выбран метод квадратов (Пирсона), т.к. каждый из признаков (жесткость воды и количество кальция) имеет числовое выражение; нет открытых вариант.

Решение.
Последовательность расчетов изложена в тексте, результаты представлены в таблице 2. Построив ряды из парных сопоставляемых признаков, обозначить их через х (жесткость воды в градусах) и через у (количество кальция в воде в мг/л).

                                                                                                                Таблица 2

Жесткость воды (в градусах) x Количество кальция в воде (в мг/л) y dх dу dх х dу dx2 dy2
4 8 11 27 34 37 28 56 77 191 241 262 -16 -12 -9 +7 +14 +16 -114 -86 -66 +48 +98 +120 1824 1032 594 336 1372 1920 256 144 81 49 196 256 12996 7396 4356 2304 9604 14400
Мх=Σ х / n Му=Σ у / n Σ dх x dу=7078 Σ dх2=982 Σ dy2=51056
Мх=120/6=20 Мy=852/6=142

 

 

1. Определить средние величины Mx ряду вариант "х" и Му в ряду вариант "у" по формулам:
Мх = Σх/n (графа 1)
Му = Σу/n (графа 2)

2. Найти отклонение (dх и dу) каждой варианты от величины вычисленной средней в ряду "x" и в ряду "у"
dх = х -Мх (графа 3) и dy = у -Му (графа4).

3. Найти произведение отклонений dx х dy и суммировать их: Σ dх х dу (графа 5)

4. Каждое отклонение dx и dу возвести в квадрат,  и суммировать их значения по ряду "х" и по ряду "у": Σ dx2 = 982 (графа 6) и Σ dy2 = 51056 (графа 7).

5. Определить произведение Σ dx2 х Σ dy2 и из этого произведения извлечь квадратный корень

6. Полученные величины Σ (dx x dy) и √(Σdx2 x Σdy2) подставляем в формулу расчета коэффициента корреляции:

 

=  =  =

 

7. Определить достоверность коэффициента корреляции:
1-й способ. Найти ошибку коэффициента корреляции (mrxy) и критерий t по формулам:

 

14,1

Критерий t = 14,1, что соответствует вероятности безошибочного прогноза ρ> 99,9%.

2-й способ. Достоверность коэффициента корреляции оценивается по таблице "Стандартные коэффициенты корреляции" (см. приложение 1). При числе степеней свободы (n — 2)=6 – 2=4, наш расчетный коэффициент корреляции r = + 0,99 больше табличного (rтабл = + 0,917 при ρ = 99%).

Вывод. Чем больше кальция в воде, тем она более жесткая (связь прямая, сильная и достоверная: rху = + 0,99, ρ > 99,9%).

 

 







Задача 3 - эталон

Определить коэффициент корреляции Пирсона, сделать выводы
Результаты определения потребного количества калорий в сутки в зависимости от веса, у девочек 8 лет (табл. 1).

                                                                                                              Таблица 1

Средний вес 8-летних девочек (кг) Потребное количество ккал.в сутки/кг веса
21 22 24 25 27 28 29   61,9 63,6 62,5 64,0 61,1 60,7 60,3  

 

 

Построив ряды из парных сопоставляемых признаков, обозначить их через х (вес девочек в килограммах) и через у (потребного количества килокалории в сутки в зависимости от веса, у девочек 8 лет) (табл. 2)

                                                                                                                 Таблица 2

 

  Вес девочек (кг), X Потребное количество ккал в сутки/кг веса, Y dx = dy dx×dy dx2 dy 2
1 21 61,9 4 4,1 0,1 0,41 16,81 0,01
2 22 63,6 6 3,1 –1,6 –4,96 9,61 2,56
3 24 62,5 5 1,1 –0,5 –0,55 1,21 0,25
4 25 64,0 7 0,1 –2,0 –0,2 0,01 4,0
5 27 61,1 3 –1,9 0,9 –1,71 3,61 0,81
6 28 60,7 2 –2,9 1,3 –3,77 8,41 1,69
7 29 60,3 1 –3,9 1,7 –6,63 15,21 2,89
  Мх=Σ х / n Му= Σ у / n     Σ dх x dу=-17,41 Σ dх2= 54,87 Σ dy2= 12,21
  Мх=176/7=25,1 Мy= 434,1/7=  62,0          

 

1. Определить средние величины Mx ряду вариант "х" и Му в ряду вариант "у" по формулам:
Мх = Σх/n (графа 1)
Му = Σу/n (графа 2)

2. Найти отклонение (dх и dу) каждой варианты от величины вычисленной средней в ряду "x" и в ряду "у"
dх = х -Мх (графа 3) и dy = у -Му (графа4).

3. Найти произведение отклонений dx х dy и суммировать их: Σ dх х dу (графа 5)

4. Каждое отклонение dx и dу возвести в квадрат, и суммировать их значения по ряду "х" и по ряду "у": Σ dx2 = 982 (графа 6) и Σ dy2 = 51056 (графа 7).

5. Определить произведение Σ dx2 х Σ dy2 и из этого произведения извлечь квадратный корень

6. Полученные величины Σ (dx x dy) и √(Σdx2 x Σdy2) подставляем в формулу расчета коэффициента корреляции:

 

=  =  =

Вывод: связь корреляционная, сильная, обратная.

 

7. Определить достоверность коэффициента корреляции:
Представительность коэффициента корреляции может быть определена по его средней ошибке, которую можно вычислить по формуле:

 

Коэффициент корреляции достоверен в том случае, если он превышает свою ошибку в 3 и более раз. Это условие в данном случае не выполняется.

8.  Оценка значимости по t–критерию:

2,03

Так как t > 2, то это говорит о значимости критерия.
    Вывод: в результате проведённого анализа полученных данных можно говорить о наличии сильной и обратной взаимосвязи между средним весом 8-летних девочек и потребным количеством калорий в сутки. При расчете и оценке коэффициента Пирсона вычислили его ошибку: т.к. она не более чем в 3 раза меньше самого коэффициента, можно говорить о недостоверности данного коэффициента. Также была проведена оценка значимости по t–критерию: т.к. t > 2, можно говорить о значимости полученных результатов.
Таким образом, можно говорить о недостаточной достоверности влияния веса 8-летних девочек на потребное количество калорий в сутки и о значимости полученных результатов.

 









Задача 4 - эталон

На основе приведенных данных в таблице 1 требуется: 1) вычислить коэффициент корреляции рангов; 2) определить характер и силу связи между соответствующими признаками; определить достоверность коэффициента корреляции.

Задание: д лина и масса тела у 12 девочек в возрасте 5 лет (табл. 1):

                                                                                                        Таблица 1

Длина тела (см.)

  Масса тела  (кг.)
   

87

13

95

14

115

20

89

12

90

14

90

15

101

17

95

15

110

18

110

21

88

14

93

16

 

Решение.

1. Рангами (порядковыми номерами) обозначаем места показателей в рядах «x» и «y» (табл. 2), затем находим разность между рангами (d) и возводим ее в квадрат (d2). При обозначении места показателей рангами начинают с меньшего (или с большего).

Если отдельные показатели ряда встречаются несколько раз (14, 15, 90, 95, 110) ранги проставляются следующим образом: масса тела 14 кг.встречается трижды занимая по величине 3-е, 4-е и 5-е места, поэтому порядковые номера в этом случае будут равны

т.е. против каждого показателя 14 кг.будет проставлен ранг 4 и т.д.

 

                                                                                                              Таблица 2

Длина тела

 (см.)

x

Масса тела

 (кг.)

y

Порядковые номера (ранги)

Разность рангов Квадрат разности рангов
X Y d = (х-у) d2
87 13 1 2 -1 1
95 14 7,5 4 +3,5 12,25
115 20 12 11 +1 1
89 12 3 1 +2 4
90 14 4,5 4 +0,5 0,25
90 15 4,5 6,5 -2 4
101 17 9 9 0 0
95 15 7,5 6,5 +1 1
110 18 10,5 10 +0,5 0,25
110 21 10,5 12 -1,5 2,25
88 14 2 4 -2 4
93 16 6 8 -2 4
           
Σ d2 = 34

 

Подставляем полученные данные в формулу коэффициента корреляции рангов:        

= 1 -  = 1 -

2. Коэффициент корреляции, равный + 0,881, свидетельствует о наличии прямой сильной связи между ростом девочек и массой их тела.

3. Определяем достоверность коэффициента ранговой корреляции.

1-й способ. Определяем ошибку (m ρху) коэффициента ранговой корреляции и оцениваем достоверность его с помощью критерия t:

 =  = 0,15

Полученный критерий t = 5,867 соответствует вероятности безошибочного прогноза ρ больше 95 %:

ρху = 0,881; m ρху = ± 0,15;  t = 5,867; ρ > 95%.

 

2-й способ. Достоверность коэффициента корреляции оценивается по таблице «Стандартных коэффициентов корреляции». При числе степеней свободы (n - 2) = 12 - 2 = 10 наш расчетный коэффициент корреляции ρху= 0,881 больше табличного 0,708 что соответствует вероятности безошибочного прогноза больше 99%. Это позволяет считать полученный коэффициент ранговой корреляции достоверным.

Вывод. С вероятностью безошибочного прогноза (р) больше 99% установлено, что чем больше  рост, тем больше масса тела  (связь прямая, сильная, достоверная корреляционная: ρху = 0,881, ρ > 99%.

 

Задача5 – эталон


Путем вычисления коэффициента ранговой корреляции Спирмена определить характер и размер связи между уровнем мертворождаемости и весом ребенка при рождении (табл. 1).

                                                                                         Таблица 1

 

Вес в граммах Мертворождаемость (на 1000 родов)
до 1500 137,2
1500 – 1749 86
1750 – 1999 44,2
2000 – 2249 35,6
2250 – 2499 18
2500 – 2749 12
2750 – 3000 7,2

 

 

Решение:

 

1. Каждый из рядов парных признаков обозначить через "х" и через "у" (графы 1—2).

2. Величину каждого из признаков заменить ранговым (порядковым) номером. Порядок раздачи рангов в ряду "x" следующий: минимальному значению признака (вес в граммах до 1500) присвоен порядковый номер "1", последующим вариантам этого же ряда признака соответственно в порядке увеличения 2-й, 3-й, 4-й и 5-й порядковые номера — ранги (см. графу 3).

Аналогичный порядок соблюдается при раздаче рангов второму признаку "у" (графа 4) (табл. 2).

                                                                                                         Таблица 2

Вес (в граммах),

Х

Мертворож-

даемость,

Y

Ранги

d

d2

Х Y
до 1500 137,2 1 7 – 6 36
1500 – 1749 86 2 6 – 4 16
1750 – 1999 44,2 3 5 – 2 4
2000 – 2249 35,6 4 4 0 0
2250 – 2499 18 5 3 2 4
2500 – 2749 12 6 2 4 16
2750 – 3000 7,2 7 1 6 36
n = 7          =112

 

3. Определить разность рангов d = (х - у) - (графа 5)

4. Разность рангов возвести в квадрат (d2) и получить сумму квадратов разности рангов Σ d2 (графа 6).

5. Произвести расчет коэффициента ранговой корреляции по формуле:

где n — число сопоставляемых пар вариант в ряду "x" и в ряду "у"

 

Вывод: установлена функциональная связь.

 

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: