Метрики оценки в классификации
Задачи классификации в машинном обучении требуют использования различных метрик для оценивания качества модели. Эти метрики позволяют оценить, насколько точно и эффективно модель классифицирует данные.
Основные метрики классификации
Точность (Accuracy): Показывает долю правильно классифицированных объектов из общего числа примеров. Рассчитывается как отношение суммы истинно положительных (TP) и истинно отрицательных (TN) значений к общему количеству наблюдений:
$$ \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} $$
Полнота (Recall): Измеряет способность модели находить все положительные примеры. Рассчитывается как отношение истинно положительных значений к сумме истинно положительных и ложно отрицательных (FN) значений:
$$ \text{Recall} = \frac{TP}{TP + FN} $$
Точность (Precision): Показывает, насколько правильны предсказания модели среди всех положительных предсказаний. Вычисляется как отношение истинно положительных значений к сумме истинно положительных и ложно положительных (FP):
$$ \text{Precision} = \frac{TP}{TP + FP} $$
F1-мера: Является гармоническим средним между точностью (Precision) и полнотой (Recall). Применяется в задачах, где необходимо подобрать баланс между этими двумя метриками:
$$ \text{F1} = 2 \cdot \frac{Precision \cdot Recall}{Precision + Recall} $$
Дополнительные метрики
Специфичность (Specificity): Показывает долю истинно отрицательных классификаций среди всех фактически отрицательных примеров.
Получаемая операционная характеристическая кривая (ROC-AUC): Измеряет способность модели различать классы при разных порогах, давая возможность оценить общую мощность модели.
Выбор метрики зависит от специфики задачи и требований к модели, например, при анализе медицинских данных более значимыми могут быть специфичность и полнота, чем точность.
Ключевые темы: модели классификации, точность, полнота, F1-мера, ROC-AUC.
Категория: Машинное обучение
Теги: метрики классификации, машинное обучение, оценка качества