机器学习入门 模型评估指标
# Introducción al Aprendizaje Automático - Métricas de Evaluación del Modelo
## Referencias y Agradecimientos
- 《Fundamentos del Aprendizaje Automático - De Principiante a Empleado》
- [Fundamentos del Aprendizaje Automático - Aprendizaje Supervisado - Función Objetivo de Error Absoluto Medio (Mean Absolute Error, MAE)](https://juejin.cn/post/7249627865426247735)
- [scikit-learn.org](https://scikit-learn.org/)
- [sklearn.metrics.mean_absolute_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_absolute_error.html)
- [sklearn.metrics.mean_squared_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html)
---
Diferentes tareas de aprendizaje automático requieren el uso de métricas distintas para evaluar. En este artículo, basado en scikit-learn, se presentan las métricas de evaluación de tres tipos de modelos: regresión, clasificación y agrupación.
## Métricas de Evaluación del Modelo de Regresión
Para un modelo de regresión, el objetivo es que las predicciones se ajusten lo mejor posible a los valores reales. Las métricas comúnmente utilizadas son el error absoluto y el error cuadrático medio.
### Error Absoluto Medio (Mean Absolute Error, MAE)
Se utiliza para medir la diferencia promedio en valor absoluto entre las predicciones y los valores reales en problemas de regresión. Cuanto menor sea el valor de MAE, menor será la diferencia promedio entre las predicciones y los valores reales, lo que indica una mayor precisión en las predicciones.
$$
MAE = \frac{1}{n} \sum_{i=1}^{n} |y_{\text{true}, i} - y_{\text{pred}, i}|
$$
Donde, $n$ es el número de muestras, $y_\text{true}$ son los valores reales y $y_\text{pred}$ son las predicciones.
```python
>>> from sklearn.metrics import mean_absolute_error
>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_absolute_error(y_true, y_pred)
0.5
>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_absolute_error(y_true, y_pred)
0.75
Error Cuadrático Medio (Mean Squared Error, MSE)
Se emplea para medir la diferencia cuadrática promedio entre las predicciones y los valores reales. Un valor menor indica un mejor ajuste entre las predicciones y los valores reales.
\[ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_{\text{true}, i} - y_{\text{pred}, i})^2 \]
Donde, \(n\) es el número de muestras, \(y_\text{true}\) son los valores reales y \(y_\text{pred}\) son las predicciones.
>>> from sklearn.metrics import mean_squared_error
>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_squared_error(y_true, y_pred)
0.375
>>> y_true = [[0.5, 1],[-1, 1],[7, -6]]
>>> y_pred = [[0, 2],[-1, 2],[8, -5]]
>>> mean_squared_error(y_true, y_pred)
0.708...
Métricas de Evaluación del Modelo de Clasificación
Existen varias métricas de evaluación para los modelos de clasificación, e incluso pueden surgir conflictos entre ellas. ```
Este post está traducido usando ChatGPT, por favor feedback si hay alguna omisión.