Метрики для оценки качества моделей регрессии
В задачах регрессии оценка качества моделей играет ключевую роль. Насколько точно модель предсказывает непрерывные значения, зависит от выбора метрик. Рассмотрим наиболее распространенные метрики, используемые для этой цели.
Среднеквадратичная ошибка (MSE)
Среднеквадратичная ошибка (Mean Squared Error) — одна из самых популярных метрик. Она вычисляется по формуле:
$$MSE = \frac{1}{n} \sum{i=1}^{n} (y_i - \hat{y}i)2$$
где $y_i$ — фактические значения, а $\hat{y}_i$ — предсказанные моделью. Чем меньше MSE, тем лучше модель подгоняется под данные. Однако, эта метрика чувствительна к выбросам.
Средняя абсолютная ошибка (MAE)
Средняя абсолютная ошибка (Mean Absolute Error) измеряет среднюю величину ошибок в единицах целевых переменных:
$$MAE = \frac{1}{n} \sum{i=1}^{n} |y_i - \hat{y}i|$$
MAE отражает среднюю ошибку предсказаний и менее чувствительна к выбросам, чем MSE.
Коэффициент детерминации ($R2$)
Коэффициент детерминации показывает долю дисперсии целевой переменной, которую объясняет модель. Значение $R2$ варьируется от 0 до 1, и чем ближе оно к 1, тем лучше модель объясняет данные:
$$R2 = 1 - \frac{\sum (y_i - \hat{y}_i)2}{\sum (y_i - \bar{y})2}$$
Корень из среднеквадратичной ошибки (RMSE)
Корень из среднеквадратичной ошибки позволяет интерпретировать ошибку в тех же единицах, что и целевые переменные:
$$RMSE = \sqrt{MSE}$$
Это делает RMSE более интуитивно понимаемой, однако она также сохраняет чувствительность к выбросам. Выбор метрики зависит от характера данных и специфики задачи. Совместное использование нескольких метрик позволяет построить более полного представления о качестве модели.
Метрики оценки качества регрессии: MSE, MAE, RMSE, R-квадрат.
Категория: Машинное обучение
Теги: регрессия, метрики оценки, машинное обучение