Saltar a contenido

机器学习入门 模型评估指标

# Introducción al Aprendizaje Automático - Métricas de Evaluación del Modelo

## Referencias y Agradecimientos

- 《Fundamentos del Aprendizaje Automático - De Principiante a Empleado》
- [Fundamentos del Aprendizaje Automático - Aprendizaje Supervisado - Función Objetivo de Error Absoluto Medio (Mean Absolute Error, MAE)](https://juejin.cn/post/7249627865426247735)
- [scikit-learn.org](https://scikit-learn.org/)
  - [sklearn.metrics.mean_absolute_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_absolute_error.html)
  - [sklearn.metrics.mean_squared_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html)

---

Diferentes tareas de aprendizaje automático requieren el uso de métricas distintas para evaluar. En este artículo, basado en scikit-learn, se presentan las métricas de evaluación de tres tipos de modelos: regresión, clasificación y agrupación.

## Métricas de Evaluación del Modelo de Regresión

Para un modelo de regresión, el objetivo es que las predicciones se ajusten lo mejor posible a los valores reales. Las métricas comúnmente utilizadas son el error absoluto y el error cuadrático medio.

### Error Absoluto Medio (Mean Absolute Error, MAE)

Se utiliza para medir la diferencia promedio en valor absoluto entre las predicciones y los valores reales en problemas de regresión. Cuanto menor sea el valor de MAE, menor será la diferencia promedio entre las predicciones y los valores reales, lo que indica una mayor precisión en las predicciones.

$$
MAE = \frac{1}{n} \sum_{i=1}^{n} |y_{\text{true}, i} - y_{\text{pred}, i}|
$$

Donde, $n$ es el número de muestras, $y_\text{true}$ son los valores reales y $y_\text{pred}$ son las predicciones.

```python
>>> from sklearn.metrics import mean_absolute_error

>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_absolute_error(y_true, y_pred)
0.5

>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_absolute_error(y_true, y_pred)
0.75

Error Cuadrático Medio (Mean Squared Error, MSE)

Se emplea para medir la diferencia cuadrática promedio entre las predicciones y los valores reales. Un valor menor indica un mejor ajuste entre las predicciones y los valores reales.

\[ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_{\text{true}, i} - y_{\text{pred}, i})^2 \]

Donde, \(n\) es el número de muestras, \(y_\text{true}\) son los valores reales y \(y_\text{pred}\) son las predicciones.

>>> from sklearn.metrics import mean_squared_error

>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_squared_error(y_true, y_pred)
0.375

>>> y_true = [[0.5, 1],[-1, 1],[7, -6]]
>>> y_pred = [[0, 2],[-1, 2],[8, -5]]
>>> mean_squared_error(y_true, y_pred)
0.708...

Métricas de Evaluación del Modelo de Clasificación

Existen varias métricas de evaluación para los modelos de clasificación, e incluso pueden surgir conflictos entre ellas. ```

Este post está traducido usando ChatGPT, por favor feedback si hay alguna omisión.