Расширенное сходство Жаккара

Коэффициент Жаккара измеряет соотношение признаков (в нашем случае, терминов), общих, для обоих векторов (документов) к их совокупному количеству в векторах (документах) [5]. Так, если у нас есть два вектора xa и xb, то формула их сходства будет:

. (22)

Было установлено [5], что при сходствах S, стремящихся к 0, сходство Жаккара ведет себя как мера косинуса, а при сходствах, приближающихся к 1, как евклидова метрика.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: