Этот сайт лучше всего просматривать в современном браузере с включённым JavaScript.

Что такое precision и recall в оценке моделей машинного обучения?

YuriMaster

Precision и Recall в машинном обучении

Precision

Precision (или точность) — это метрика, используемая для оценки качества классификационной модели. Она показывает, как много из предсказанных моделью положительных результатов действительно являются положительными. Расчитывается как:
$$
Precision = \frac{TP}{TP + FP}
$$
где $TP$ обозначает количество истинно положительных результатов, а $FP$ — количество ложноположительных результатов.

Высокое значение precision говорит о том, что модель редко ошибается, присваивая отрицательному объекту положительный класс.

Recall

Recall (или полнота) измеряет способность модели обнаруживать все положительные результаты из доступных. Он показывает, сколько из всех истинно положительных объектов модель действительно нашла:
$$
Recall = \frac{TP}{TP + FN}
$$
где $FN$ — количество ложноотрицательных результатов.

Высокое значение recall свидетельствует о том, что модель успешно выявляет большую долю положительных примеров.

Взаимосвязь Precision и Recall

Часто существует компромисс между precision и recall. Повышение precision может привести к снижению recall, и наоборот. Для разных задач эти метрики могут иметь разное значение: важно определить, что более критично — минимизация ложноположительных или ложноотрицательных ошибок.

Формально, для объединения этих двух показателей существует мера $F_1$, которая представляет собой гармоническое среднее precision и recall:
$$
F_1 = 2 \times \frac{Precision \times Recall}{Precision + Recall}
$$

Применение

В задачи, где критична полнота (например, диагностика заболеваний), акцент делается на высокие показатели recall. В задачах, где важна уверенность в положительном предсказании (например, антифрод-системы), фокус смещается на высокое значение precision.

Знание и понимание взаимосвязи этих метрик позволяет более точно настраивать модели и выбирать наиболее подходящие для конкретных задач машинного обучения.

Категория: Информатика

Теги: машинное обучение, анализ данных, моделирование