Ответ:
Имеются данные о структуре и объемах потребительских расходов n-российских семей в виде выборки y1, y2, …, yn.
Исходная информация для задачи:
1) бюджеты домашних хозяйств;
2) RLMS – данные бюджетов 4 тыс. семей за 199602000 гг.
Пусть имеется выборка из генеральной совокупности семей объемом n, законы распределения которой описываются смесью как нормальных законов, причем k-неизвестных с функцией плотности вида:
,
где известный вектор θ включает все неизвестные параметры модели: θ (k, π1, … πk-1, а(1), …, а(к), ∑(1), …, ∑(к)).
Требуется по выборке Vn получить наилучшие оценки вектора θ, а также предложить такое правило классификации , которая позволила бы классифицировать имеющиеся n-наблюдений по -типов потребительского поведения с наименьшей вероятностью ошибки классификации. При этом предполагается, что каждый тип потребительского поведения описывается многомерным нормальным распределением с параметрами (а(j); ∑(j)).
Эта задача известна в многомерном статистическом анализ как задачи классификации, основанные на смеси нормальных распределений.