Метод k-медианМетод -медиан[1][2] — применяемая в статистике и машинном обучении вариация метода -средних для задач кластеризации, где для определения центроида кластера вместо среднего вычисляется медиана. Такой подход соответствует минимизации ошибки по всем кластерам в метрике с 1-нормой, вместо метрики с 2-нормой, используемой в стандартном методе -средних. Задача определения -медиан состоит в поиске таких центров, что сформированные по ним кластеры будут наиболее «компактными». Формально, при заданных точках данных , центров должны быть выбраны так, чтобы минимизировать сумму расстояний от каждой до ближайшего . Метод иногда работает лучше, чем метод -средних, где минимизируется сумма квадратов расстояний. Критерий суммы расстояний широко используется для транспортных задач[3]. Ещё альтернатива — метод -медоидов, в котором ищут оптимальный медоид, а не медиану кластера (медоид является одной из точек данных, в то время как медианы таковыми быть не обязаны). Ссылки
Information related to Метод k-медиан |