Тема: Применение информационно-картографического подхода к анализу связей природных явлений

Продолжительность 4 часа

Задание: Выполните пространственный анализ закономерностей между заданными преподавателем факторами информационным методом.

Ход работы:

Определите моделируемую систему, выделив компонент и факторы, определяющие состояние выбранного компонента.

Подготовьте исходные данные, для этого: постройте с помощью ГИС ArcView 3.1 цифровые карты компонента и факторов. Далее необходимо разбить на зоны все карты так, чтобы и факторы и компоненты были разбиты на несколько интервалов.

С помощью функции ГИС «Гистограмма по зонам» подготовьте данные для таблиц частот наблюдений для каждого однофакторного канала связи. Количество строк в каждой таблице равно количеству интервалов фактора, а количество столбцов равно количеству интервалов компонента.[1]

С помощью компьютерной программы INFORM вычислите основные характеристики информационного анализа для каждой однофакторной связи «фактор Вi - компонент А».

Выполните анализ полученных данных, при этом постарайтесь выяснить, в какой степени факторы влияют на компонент ПТК; где эта связь крепче или, наоборот, слабее; если каждому состоянию компонента соответ­ствует определенный интервал значений факторов, то какой именно; каков объем экологической ниши, занимаемый каждым состоянием компонента в многомерном пространстве факторов; какие именно показатели определяют локализацию тех или иных состоя­ний компонента на исследуемой территории.

1. на основе коэф­фициентов информативности постройте графики плотности связи, откладывая по оси ординат значения коэф­фициентов информативности фактора, а по оси абсцисс значения фактора.

2. Сопоставляя значения коэффициентов эффективно­сти передачи информации от факторов к компоненту в однофакторных каналах связи «компонент В – фактор Аi» определите: а) ведущий фактор в определении пространственного поведения компонента; б) порядок значимости факторов в поведении компонента.

3. Постройте карту плотности связи для ведущего фактора.

4. Выявите с помощью коэф­фициентов информативности и коэффициентов связи: а) участки наибольшей и минимальной инфор­мативности факторов о компоненте; б) взаимоспецифичные состояния (С(ai|bj)>1).

На основании коэффициентов связи определите экологиче­ские амплитуды типологических единиц компонента по каждому фактору. Положение коэффициентов связи (знаков «+» для С(ai|bj)>1) прямо указывает на пределы крайних значений фактора, при которых встречается то или иное состояние компонента, т. е. характеризует амплитуду устойчивости данного варианта компонента по отношению к рассматриваемому фактору. Разновидностью экологической амплитуды является относи­тельная мера устойчивости по отношению к тому или иному фактору. Если для каждого фактора принять разность крайних значений, наблюдаемых на исследуемой терри­тории за условную единицу, то экологическая амплитуда по каждому фактору для каждого варианта компонента может быть выражена как доля рассматриваемого интервала крайних значений фактора. Очевидно, что, чем больше доля в каждом конкретном случае, тем больше ус­тойчивость того или иного варианта компонента к изменениям данного фактора.

Таким образом, экологическая амплитуда по каждому фактору для каждого варианта компонента может выражаться как в реаль­ных значениях данного фактора, так и как доля от условной еди­ницы. Применение объективных экологических амплитуд, выра­женных в долях единицы, значительно расширяет возможности анализа и позволяет получить ряд количественно подкрепленных выводов.

Логично предположить, что чем больше средние значения экологической амплитуды по рас­сматриваемому фактору, тем больше при­способленность данной группы типологических единиц компонента к изменениям фактора; чем меньше среднее значение экологиче­ской амплитуды по фактору, тем больше значимость этого показателя в пространственном поведении дан­ной группы типологических единиц компонента.

Информационно-картографический анализ открывает широ­кие возможности для объективного изучения пространственных связей природных явлений.

Вопросы для самопроверки

1. Как на основе информационного анализа сделать прогноз компонента по заданной совокупности значений факторов?

2. Какова точность информационного анализа?

3. Перечислите преимущества и недостатки информационного анализа.

ЛАБОРАТОРНАЯ РАБОТА № 8

Тема: Применение кластерного анализа в экологических исследованиях с использованием пакета прикладных программ "STATISTICA"

Продолжительность 4 часа

Основная цель работы: изучение особенностей применения многомерных методов анализа (кластерный) в экологических исследованиях.

Теоретическая часть:

Кластерный анализ относится к многомерным методам математического анализа. Его используют, когда необходимо провести классификацию объектов.

Общей задачей классификации является упорядочение элементов относительно друг друга по их взаимоотношениям в выборке. Любая классификация вообще, и кластер-анализ в частности, обеспечивает уменьшение размерности изучаемого явления [1].

Задача кластерного анализа заключается в разбиении множества объектов I на некоторое количество m кластеров (подмножеств), при этом необходимо, чтобы элементы объектов принадлежащие одному и тому же кластеру были сходными, а принадлежащие разным кластерам были разнородными (несходными).

Допустим, что у нас имеется несколько стран, каждая из которых характеризуется валовым национальным продуктом на душу населения (С1), личным потреблением на душу населения (С2), душевым потреблением электроэнергии (С3) и т.д., тогда подмножество Х1 (вектор измерений) представляет собой набор перечисленных характеристик для первой страны, Х2 для второй, Х3 для третьей. Задача заключается в том, чтобы разбить страны по уровню развития.

Решением задачи кластерного анализа является разбиение некоторого количества объектов с помощью определенного критерия (метрики). Этот критерий может представлять собой некоторый функционал, который так группирует объекты (выделяет кластеры), чтобы попавшие в него переменные были наиболее сходными, соответственно, различные подмножества (кластеры) - наиболее разнородными. Этот функционал часто называют целевой функцией или метрикой (например, в качестве целевой функции можно взять внутригрупповую сумму квадратов отклонений).

СТРАНА_1 СТРАНА_2 СТРАНА_3 СТРАНА_4 СТРАНА_5 СТРАНА_6 СТРАНА_7 СТРАНА_8 СТРАНА_9 СТРАНА10

С1 104,000 694,000 360,000 1563,000 2117,000 800,000 70,000 72,000 946,000 180,0000

С2 40,000 696,000 393,000 1552,000 2782,000 872,000 203,000 68,000 1048,000 208,0000

С3 72,000 725,000 422,000 1625,000 2927,000 676,000 296,000 80,000 1102,000 181,0000

Рисунок 1 - Классификация стран по уровню развития

Методологические особенности кластерного анализа сводятся к выявлению единой меры, охватывающих ряд исследуемых признаков, т.е. необходимо количественно определить понятия сходства и разнородности. Задачу можно считать решенной, если i-й и j-й объекты попадали в один и тот же кластер всякий раз, когда расстояние (отдаленность) между соответствующими точками Хi и Хj было бы достаточно малым, и наобарот, попадали в разные кластеры, если бы расстояние между точками Хi и Хj было бы, "достаточно большим". Для достижения этой цели, оперируют понятием расстояния, как некой функцией между точками Хi и Хj в пространстве, с абстрактных позиций. Эти признаки объединяются с помощью метрики в один количественный показатель сходства группируемых объектов.

Классификация будет наиболее точно отображать реальность в том случае, когда вид метрики наилучшим образом соответствует форме отношений между свойствами. Выделяются два типа отношений: линейные и нелинейные. Формулировка гипотезы о типе отношений – наиболее сложная задача.

Например, в работе [2] при изучении миграции и перераспределения химических элементов в ландшафтном пространстве в качестве таких отношений выделялось подобие в распределении химических элементов. Поэтому при введении метрики необходимо избавиться от абсолютных значений. Наиболее простой способ для этого – стандартизация данных каждой переменной делением отклонения от среднего на среднеквадратическое отклонение соответствующей переменной. При классификации эксперименты проводились с четырьмя видами метрик:

1) метрика Эвклида: , где xi, yi – значения сравниваемых переменных в образце почвы i; 2) квадратическая метрика Эвклида: ; метрика Миньковского: при r=1; 4) метрика Пирсона: , где r – коэффициент корреляции.

Самих методов классификации существует несколько (метод ближайшего соседа, дальнего соседа, взвешенных и невзвешенных центроидов и т.д.)

На основе сравнения результатов разных классификаций выбирается та из них, которая наилучшим образом соответствует некоторым критериям оптимальности.

Результаты кластеризации представляются графически в виде дендограммы или диаграммы-дерева.

В диаграмме-дереве объекты располагаются вертикально слева, а результаты кластеризации справа. Значения расстояний или сходства изображаются на горизонтальной прямой поверх дендограммы.

На рис. 1 показана диаграмма-дерево для примера со странами, описанного выше. Из диаграммы-дерева видно, что наиболее близки по уровню жизни страна_1 и страна_8, страна_7 и страна_10, а также страна_2 и страна_6. Вид дендограммы зависит от выбора меры сходства или расстояния между объектом и кластером и метода кластеризации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: