Для начала нам следует убедиться, что цена на золото и указанные выше параметры действительно взаимосвязаны. Для этого нам придется построить матрицу парных корреляций, чтобы понять, нет ли лишних данных среди тех, которые мы собираемся использовать.
С помощью программы Statistica 6.1 построим матрицу парных корреляций:
Рисунок 2 –Матрица парных корреляций
Как видно из рисунка 2 – практически все выбранные нами параметры статистически значимы при построении данной модели. Также можно заметить и то, что из входных данных наиболее сильно между собой связаны изменения курсов платины и палладия, но, в свою очередь, эти два показателя имеют достаточно сильную связь с результатирующим признаком.
Чтобы избавиться от сильной корреляции между признаками, сделаем преобразования: сложим изменения цен на платину и палладий, и также найдем их относительное изменение. Также видно, что переменные «число», «месяц» и «серебро» имеют слабую связь с изменением цены на золото, исключим эти переменные. Для проверки необходимо построить еще одну матрицу парных корреляций. Она приведена на рисунке 3.
|
|
Рисунок 3 – Матрица парных корреляций
Таким образом, для нашей модели входными данными будут служить переменные:
1. Относительное изменение курса доллара;
2. Относительное изменение курса евро;
3. Изменение курсов платины и палладия, объединенные в одну переменную путем сложения.