1) Из группы курсантов случайным образом отобраны 10 человек. Данные об их оценках по математике и среднее из оценок по остальным дисциплинам сводятся в таблицу.
2) Из большого мешка, содержащего монеты одинакового достоинства, не глядя выбирают 10 монет. По дате выпуска определяют их возраст, после чего взвешивают. Результаты сводят в таблицу.
3) Случайным образом отбираются данные о работе 10 однотипных судов. Для каждого судна выписывается в таблицу загрузка и время рейса.
Каждый из этих экспериментов - парный, объем выборки в каждом из них равен 10. Из них следует выявить зависимости:
1) Если курсант имеет по математике «отлично», то будет ли высокой его успеваемость по другим предметам?
2) Будет ли старая монета меньше весить, чем новая?
3) Будет ли судно в более длительном рейсе больше загружено, чем в коротком?
Первый шаг в анализе - построение графиков. Наиболее простую иллюстрацию парных наблюдений дает график рассеивания (рис.2.13).
На таком графике любые два измерения считаются упорядоченной парой чисел и изображаются точкой на плоскости в прямоугольной системе координат. Т.о. каждому объекту соответствует точка на плоскости. Множество точек образует график рассеивания эксперимента.
|
|
Из графиков на рис.2.13, соответствующих приведенным выше примерам парных экспериментов, видно, что на первый вопрос можно ответить «трудно сказать», на второй и третий - «да, в среднем».
В многомерных экспериментах, когда говорят о статистической зависимости, обычно пользуются словом корреляция. Графики 2 и 3 на рис.2.13 отражают соответственно отрицательную и положительную корреляции. Первый график этого рисунка не выражает сколько-нибудь заметного соответствия между парой величин, поэтому можно говорить о том, что они некоррелированы.
Если все пары значений абсолютно точно удовлетворяют некоторому уравнению, это значит, что случайные величины полностью коррелированы или функционально связаны. В других случаях наблюдается меньшая степень корреляции, соответственно степени удаления точек от регулярной кривой. Если точки рассеяны беспорядочно, не группируясь, - случайные величины некоррелированы.