С помощью данного метода вычисляется порог t, минимизирующий среднюю ошибку сегментации, т.е. среднюю ошибку от принятия решения о принадлежности пикселей изображения объекту или фону. Значения яркостей пикселей изображения можно рассматривать как случайные величины, а их гистограмму – как оценку плотности распределения вероятностей. Если плотности распределения вероятностей известны, то можно определить оптимальный (в смысле минимума ошибки) порог для сегментации изображения на два класса c0 и c 1 (объекты и фон).
В дальнейших рассуждениях предполагаем, что:
· изображение представляется с помощью L уровней яркости;
· hi – число элементов изображения, имеющих яркость i, i = 0, 1,..., L- 1;
· H – общее число пикселей на изображении;
· гистограмма изображения является нормализованной и ее можно рассматривать как распределение вероятностей
· элементы изображения делятся на два класса c0 и c 1 с помощью порогового значения t, где класс c0 содержит пиксели с яркостями из множества (0, 1,..., t), а класс c 1 – пиксели с яркостями из множества (t, t +1,..., L – 1). Вероятности каждого из этих двух классов и средние значения их яркости описываются выражениями:
где означает среднюю яркость всего изображения.
Можно легко проверить, что для любого t справедливо следующее соотношение:
Дисперсии каждого из классов определяются формулами:
Определение оптимального порога можно осуществить на основе оптимизации одной из следующих функций, зависящих от порога t:
где
– дисперсия межклассовая,
– дисперсия внутриклассовая,
– дисперсия совокупная, причем не зависит от величины порога t и выражается формулой
Стоит отметить, что требует использования статистик 2-го порядка (дисперсии классов), в то время как – статистик 1-го порядка (средние классов). Поэтому является наиболее простой мерой, зависящей от величины порога t. Исходя из этого, оптимальный порог можно вычислить по формуле:
.
Поскольку дисперсия является мерой разброса уровней яркости вокруг среднего значения, то большое ее значение свидетельствует о большом отклонении от среднего. В связи с этим операция нахождения максимума в формуле для определения порога означает увеличение изолированности двух классов на бинаризированном изображении. Итак, для бимодального изображения рассмотренный метод помещает порог между средними значениями яркости объектов и фона так, чтобы максимизировать межклассовую дисперсию .