انتقل إلى المحتوى

مقدمة في تعلم الآلة - معايير تقييم النموذج

المراجع والشكر


يحتاج مهام تعلم الآلة المختلفة إلى استخدام معايير تقييم مختلفة، يقوم هذا المقال على أساس scikit-learn، بتقديم معايير تقييم نماذج التعلم الآلي للتحليل التنبؤي، التصنيف، والتجميع من خلال الشفرات العملية.

معايير تقييم نموذج التحليل التنبؤي

بالنسبة لنماذج التحليل التنبؤي، الهدف هو جعل قيم التوقع تتلاءم بقدر الإمكان مع القيم الفعلية. تحتوي المعايير الشائعة لأداء الخوارزميات على خطأ مطلق وخطأ مربعي.

الخطأ المطلق المتوسط ​​(MAE)

تستخدم لقياس الفروقات المطلقة المتوسطة بين قيم التوقع والقيم الفعلية في مشكلات التحليل التنبؤي. كلما كانت قيمة MAE أصغر، كانت الفروقات المتوسطة بين قيم التوقع والقيم الفعلية أقل، مما يعني دقة التوقع أعلى.

\[ MAE = \frac{1}{n} \sum_{i=1}^{n} |y_{\text{true}, i} - y_{\text{pred}, i}| \]

حيث، \(n\) هو عدد العينات، \(y_\text{true}\) هي القيمة الفعلية، و \(y_\text{pred}\) هي القيمة المتوقعة.

>>> from sklearn.metrics import mean_absolute_error

>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_absolute_error(y_true, y_pred)
0.5

>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_absolute_error(y_true, y_pred)
0.75

الخطأ المربعي المتوسط ​​(MSE)

يستخدم لقياس الفروقات المربعة الكلية بين قيم التوقع والقيم الفعلية، حيث تعنى القيمة المنخفضة تجاهل أفضل بين نتائج التوقع والقيمة الفعلية.

\[ MSE = \frac{1}{n} \sum_{i=1}^{n} (y_{\text{true}, i} - y_{\text{pred}, i})^2 \]

حيث، \(n\) هو عدد العينات، \(y_\text{true}\) هي القيمة الفعلية، و \(y_\text{pred}\) هي القيمة المتوقعة.

>>> from sklearn.metrics import mean_squared_error

>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> mean_squared_error(y_true, y_pred)
0.375

>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> mean_squared_error(y_true, y_pred)
0.708...

معايير تقييم نموذج التصنيف

يوجد العديد من معايير تقييم النماذج التصنيفية، وقد تكون هذه المعايير متعارضة بعض الأحيان.

تمت ترجمة هذه المشاركة باستخدام ChatGPT، يرجى تزويدنا بتعليقاتكم إذا كانت هناك أي حذف أو إهمال.