Понятие о других методах многомерного статистического анализа

Многомерный статистический анализ определяется как раздел математической статистики, посвященный математическим методам построения оптимальных планов сбора, систематизации и обработки многомерных статистических данных, направленных на выявление характера и структуры взаимосвязей между компонентами исследуемого признака и предназначенных для получения научных и практических выводов. Многомерные статистические методы среди множества возможных вероятностно-статистических моделей позволяют обоснованно выбрать ту, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании ограниченного статистического материала. С некоторыми разделами многомерного статистического анализа, такими, как многомерный корреляционный анализ, множественная регрессия, многомерный дисперсионный анализ. Приведем теперь краткий обзор ряда других методов многомерного статистического анализа, которые уже нашли отражение в статистических пакетах прикладных программ. В первую очередь следует выделить методы, позволяющие выявить общие (скрытые или латентные) факторы, определяющие вариацию первоначальных факторов. К ним относятся факторный анализ и метод главных компонент.

Факторный анализ. Основной задачей факторного анализа является переход от первоначальной системы большого числа взаимосвязанных факторов  к относительно малому числу скрытых (латентных) факторов . Скажем, производительность труда на предприятиях зависит от множества факторов из которых многие связаны между собой. Используя факторный анализ, можно установить влияние на рост производительности труда лишь нескольких обобщенных факторов непосредственно не наблюдавшихся.

Модель факторного анализа записывается в виде:

, i=1,2,…,m, k ,

где  = M() — математическое ожидание первоначального фактора

— общие (скрытые или латентные) факторы (J = 1,2,...,k);

 — нагрузки первоначальных факторов на общие факторы;

— характерные факторы (i = 1,2,...,/я);

 — нагрузки первоначальных факторов на характерные факторы.

Первое слагаемое в модели — неслучайная составляющая, другие два слагаемых  случайные составляющие. Особенностью факторного анализа является неоднозначность определения общих факторов.

Метод главных компонент (компонентный анализ). В отличие от рассматриваемых в факторном анализе общих факторов, которые обусловливают большую (но не всю) часть вариации первоначальных факторов, главные компоненты объясняют всю вариацию и определяются однозначно. Модель главных компонент имеет вид:

, i=1,2,…m.

Как видим, в модели отсутствуют характерные факторы, так как главные компоненты  полностью обусловливают всю вариацию первоначальных факторов. Для углубления анализа изучаемого явления после выявления главных компонент рассматривают регрессию на главных компонентах, в которых последние выступают в качестве обобщенных объясняющих переменных. Среди других методов многомерного статистического анализа отметим методы, позволяющие осуществить классификацию экономических объектов, т.е. отнесение их к определенным классам. Это методы дискриминантного и кластерного анализа.

Дискриминантный анализ позволяет отнести объект, характеризующийся значениями m признаков, к одной из l совокупностей (классов, групп), заданных своими распределениями. Предполагается, что l совокупностей заданы выборками (называемыми обучаемыми), которые содержат информацию о статистических распределениях совокупностей в m-мерном пространстве признаков.

При отсутствии обучающих выборок могут быть использованы методы кластерного анализа, позволяющие разбить исследуемую совокупность объектов на группы «схожих» объектов, называемых кластерами, таким образом, чтобы объекты одного класса находились на «близких» расстояниях между собой, а объекты разных классов — на относительно «отдаленных» расстояниях друг от друга. При этом каждый объект  (j = l,2,...,m) рассматривается как точка в m-мерном пространстве, и выбор способа вычисления расстояний или близости между объектами и признаками является узловым моментом исследования, от которого в основном зависит окончательный вариант разбиения объектов на классы.

Заключение

 

В 1 главе данной работы были введены понятия функциональной, статистической и корреляционной зависимости. Разобраны методы определения линейной парной регрессии, коэффициента корреляции. Установлены основные свойства коэффициента корреляции, также сформулирована основная задача корреляционного анализа и основные свойства корреляционных отношений.

Во 2 главе настоящей работы приводятся основные положения регрессионного анализа. Указываются методы нахождения интервальной оценки функции регрессии и характеров парной модели.

Методы корреляционного и регрессионного анализа не действуют изолированно. При решении практических задач используют их совместно. В приложении 1 эти методы применяются для установления линейной зависимости между ценообразованием однотипных продуктов в магазинах юго-западных районов Брянщины. В результате исследования между ценами на продукты (яблоки, апельсины) линейной зависимости установлено не было (коэффициент r=-0.03).

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: