Наряду с наиболее вероятным значением риска важное значение имеет разброс возможных значений риска относительно его центрального значения. Учет разброса показателей необходим и при решении задач социально-гигиенического мониторинга.
Наиболее распространенными характеристиками разброса случайной величины являются дисперсия и среднеквадратичное отклонение.
Дисперсия случайной величины ξ обозначаемая как D (ξ) (используются также обозначения V (ξ) и σ2 (ξ)), характеризует наиболее вероятное значение квадрата отклонения случайной величины от своего математического ожидания.
Для дискретной случайной величины, принимающей значения хi с вероятностями рi, дисперсия определяется как взвешенная сумма нитратов отклонений хi от математического ожидания ξ с весовыми коэффициентами, равными соответствующим вероятностям:
D(ξ) =
Для непрерывной случайной величины ξ ее дисперсия определяется по формуле:
D(ξ) =
Дисперсия обладает следующими практически важными свойствами:
1.Дисперсия любой случайной величины неотрицательна:
D(ξ) ≥ 0
2. Дисперсия постоянной величины равна 0:
D(C) = 0
где С — константа.
3. Дисперсия случайной величины ξ равна разности между математическим ожиданием квадрата этой случайной величины и квадратом математического ожидания ξ:
D(ξ) = M [ξ – M (ξ)]2 = M(ξ2) – ( .
4. Прибавление константы к случайной величине не изменяет дисперсии; умножение случайной величины на константу а приводит к умножению дисперсии на а2:
D(aξ + b) = a2 D(ξ),
где а и b — константы.
5. Дисперсия суммы независимых случайных величин равна сумме их дисперсий:
,
где ξ и η - независимые случайные величины.
Среднеквадратичным отклонением случайной величины ξ (используются также термин «стандартное отклонение») называется число σ (ξ) равное квадратному корню из дисперсии ξ:
.
Среднеквадратичное отклонение измеряет отклонение случайной нвеличины от ее математического ожидания в тех же величинах, в которых измеряется сама случайная величина (в отличие от дисперсии, размерность которой равна квадрату размерности исходной случайной величины). Для нормального распределения среднеквадратичное отклонение равно параметру σ. Таким образом, математическое ожидание и стандартное отклонение представляют собой полный набор характеристик нормального распределения и однозначно определяют вид плотности распределения. Для распределений, отличающихся от нормального, эта пара показателей не является столь же эффективной характеристикой распределения.
В качестве характеристики рассеяния случайной величины используется также коэффициент вариации. Коэффициентом вариации случайной величины ξ имеющей ненулевое математическое ожидание, называется число V (ξ) равное отношению среднеквадратичного отклонения ξ к ее математическому ожиданию:
V(ξ) =
Коэффициент вариации измеряет рассеяние случайной величины в долях ее математического ожидания и часто выражается в процентах от последнего. Этой характеристикой не следует пользоваться, если математическое ожидание близко к 0 или существенно меньше стандартного отклонения (в этом случае малые ошибки при определении математического ожидания приводят к высокой погрешности для коэффициента вариации), а также, если вид плотности распределении существенно отличается от гауссовского.
Коэффициент асимметрии (As) определяет 3-ю степень отклонении случайной величины от математического ожидания и определяется по формуле:
As (ξ) =
На практике этот показатель используется в качестве оценки симметричности распределения. Для любого симметричного распределения он равен 0. Если же плотность распределения несимметрична (что часто может иметь место при оценке риска смерти и рисков, связанных с загрязнением воды и воздуха), то положительный коэффициент асимметрии соответствует случаю, когда левое плечо кривой плотности круче правого, а отрицательный — случаю, когда правое плечо круче левого (рис 4.17).
Для асимметричных распределений стандартное отклонение не является хорошим показателем рассеяния случайной величины. Для характеристики рассеяния в этом случае можно использовать такие показатели, как квартили, квантили и процентили.
Первой квартилью случайной величины ξ, имеющей функцию распределения F(х), называется число Q1 являющееся решением уравнения
F(Q1) = 1/4
т. е. такое число, для которого вероятность того, что ξ принимает значения, меньшие Q1, равна 1/4, вероятность того, что она принимает значения, большие Q1 равна 3/4.
Второй квартилью (Q2) случайной величины называется ее медиана, а третьей (Q3) — решение уравнения
F(Q3) = 3/4
Квартили делят ось абсцисс на 4 интервала: [-∞, Q1 ], [ Q1, Q2 ], [ Q2, Q3 ] и [ Q3, + ∞] в каждый из которых случайная величина попадает c равной вероятностью, а фигуру, ограниченную осью абсцисс и графиком плотности распределения — на 4 области с одинаковой площадью. И интервале между первой и третьей квартилями сосредоточено 50% распределения случайной величины. Для симметричных распределений первая и третья квартили одинаково удалены от медианы.
Квантилью порядка р случайной величины ξ с функцией распределения F(х) называется число х, являющееся решением уравнения
F(х) = р.
Таким образом, квартили являются квантилями порядка 0,25, 0,5 и 0,75. Если порядок квантили р выражается в процентах, то соответствующие значения х называются процентилями, или р -процентными точками распределения.
На рис. 4.18 показаны, наряду с квантилями, 2,5- и 97,5-процентные точки распределения. Между этими точками сосредоточено 95% распределения случайной величины, поэтому заключенный между ними интервал называют 95 %-м доверительным интервалом среднего (в частности, при оценке рисков — 95 %-м доверительным интервалом риска).
Задача 2. Какие из перечисленных ниже сведений о случайной величине ξ позволяют отвергнуть предположение о том, что она распределена по нормальному закону:
а) ξ — дискретная случайная величина;
б) математическое ожидание ξ отрицательно;
в) распределение ξ унимодально;
г) математическое ожидание ξ не равно ее медиане;
д) коэффициент асимметрии ξ отрицателен;
е) стандартное отклонение ξ больше ее математического ожидания;
ж) ξ характеризует распределение продолжительности острых заболеваний органов дыхания на исследуемой территории;
з) ξ характеризует распределение продолжительности жизни на исследуемой территории;
и) медиана ξ не совпадает с центром интервала между первой и третьей квартилями.
Ответ: Предположение о нормальном законе распределения случайной величины несовместимо с утверждениями а), г), д), з), и).
Рис. 4.17. Зависимость между знаком Рис.4.18. Квартили и процентили:
коэффициента асимметрии и формой иллюстрация с помощью функции
функции плотности распределения