Метод Отса (определение оптимального порога)

С помощью данного метода вычисляется порог t, минимизирующий среднюю ошибку сегментации, т.е. среднюю ошибку от принятия решения о принадлежности пикселей изображения объекту или фону. Значения яркостей пикселей изображения можно рассматривать как случайные величины, а их гистограмму – как оценку плотности распределения вероятностей. Если плотности распределения вероятностей известны, то можно определить оптимальный (в смысле минимума ошибки) порог для сегментации изображения на два класса c₀ и c ₁ (объекты и фон).

В дальнейших рассуждениях предполагаем, что:

· изображение представляется с помощью L уровней яркости;

· hi – число элементов изображения, имеющих яркость i, i = 0, 1,..., L- 1;

· H – общее число пикселей на изображении;

· гистограмма изображения является нормализованной и ее можно рассматривать как распределение вероятностей

· элементы изображения делятся на два класса c₀ и c ₁ с помощью порогового значения t, где класс c₀ содержит пиксели с яркостями из множества (0, 1,..., t), а класс c ₁ – пиксели с яркостями из множества (t, t +1,..., L – 1). Вероятности каждого из этих двух классов и средние значения их яркости описываются выражениями:

где означает среднюю яркость всего изображения.

Можно легко проверить, что для любого t справедливо следующее соотношение:

Дисперсии каждого из классов определяются формулами:

Определение оптимального порога можно осуществить на основе оптимизации одной из следующих функций, зависящих от порога t:

где

– дисперсия межклассовая,

– дисперсия внутриклассовая,

– дисперсия совокупная, причем не зависит от величины порога t и выражается формулой

Стоит отметить, что требует использования статистик 2-го порядка (дисперсии классов), в то время как – статистик 1-го порядка (средние классов). Поэтому является наиболее простой мерой, зависящей от величины порога t. Исходя из этого, оптимальный порог можно вычислить по формуле:

Поскольку дисперсия является мерой разброса уровней яркости вокруг среднего значения, то большое ее значение свидетельствует о большом отклонении от среднего. В связи с этим операция нахождения максимума в формуле для определения порога означает увеличение изолированности двух классов на бинаризированном изображении. Итак, для бимодального изображения рассмотренный метод помещает порог между средними значениями яркости объектов и фона так, чтобы максимизировать межклассовую дисперсию .