Этот сайт лучше всего просматривать в современном браузере с включённым JavaScript.

Как строится и интерпретируется ROC-кривая?

Volzhin

Построение и интерпретация ROC-кривой

ROC-кривая (Receiver Operating Characteristic) — это график, который используется для визуализации и оценки качества бинарного классификатора. Она показывает соотношение между истинно положительными и ложноположительными показателями при различных порогах принятия решений.

Построение ROC-кривой

Для построения ROC-кривой используем следующие шаги:

Рассчитайте вероятности: Примените модель к набору данных и получите предсказанные вероятности принадлежности объектов к положительному классу.
Установите пороги: Выберите набор порогов от 0 до 1. Эти пороги будут использоваться для определения, в какой класс отнести каждый объект.
Рассчитайте метрики: Для каждого порога рассчитайте истинно положительные (TP) и ложноположительные (FP) показатели. Истинно положительный показатель (True Positive Rate, TPR) определяется как:
[ TPR = \frac{TP}{TP + FN} ]
а ложноположительный показатель (False Positive Rate, FPR) — как:
[ FPR = \frac{FP}{FP + TN} ]
Постройте график: Нанесите FPR по оси X и TPR по оси Y для каждого выбранного порога. Полученная ломаная линия и есть ROC-кривая.

Интерпретация

Площадь под ROC-кривой (AUC): AUC (Area Under Curve) служит агрегированной мерой эффективности модели и может варьироваться от 0 до 1. AUC = 0.5 указывает на случайную классификацию, тогда как AUC = 1 означает идеальный классификатор.
Выбор модели: Модель с более высокой AUC считается лучшей, так как она дает более высокую вероятность того, что случайный положительный образец будет классифицирован моделью как положительный больше, чем случайный отрицательный образец.

ROC-анализ является важным инструментом в оценке бинарных классификаторов, так как он не привязан к конкретному порогу и обеспечивает комплексное понимание возможных компромиссов между чувствительностью и специфичностью.

Категория: Машинное обучение

Теги: классификация, метрические оценки, ROC-анализ