如何评估机器学习模型的性能

发布时间：2020-09-26 12:05:12 所属栏目：创业来源：网络整理

导读：副标题#e# 您可以整天训练有监督的机器学习模型，但是除非您评估其性能，否则您永远无法知道模型是否有用。这个详细的讨论回顾了您必须考虑的各种性能指标，并对它们的含义和工作方式提供了直观的解释。为什么需要评估？让我从一个非常简单的例子开始。

通过使用以下公式计算残差平方和，即所有误差（e_i）平方的总和，其中fi是第i个数据点的模型的预测目标值。

如何评估机器学习模型的性能

取所有实际目标值的平均值：

然后计算与测试集目标值的方差成正比的总平方和：

如何评估机器学习模型的性能

如果同时观察两个平方和的公式，则可以看到唯一的区别是第二项，即y_bar和fi。平方总和在某种程度上给我们一种直觉，即它仅与残差平方和相同，但预测值为[，，，…….，n次]。是的，您的直觉是正确的。假设有一个非常简单的均值模型，无论输入数据如何，均能每次预测目标值的平均值。

现在我们将R²表示为：

正如您现在所看到的，R²是一种度量，用于将模型与非常简单的均值模型进行比较，该均值模型每次均返回目标值的平均值，而与输入数据无关。比较有4种情况：

情况1：SS_R = 0

（R²= 1）完美的模型，完全没有错误。

情况2：SS_R> SS_T

（R²<0）模型甚至比简单的均值模型差。

情况3：SS_R = SS_T

（R²= 0）模型与简单均值模型相同。

情况4：SS_R <SS_T

（0 <R²<1）模型还可以。

因此，简而言之，您应该非常了解您的数据集和问题，然后您始终可以创建一个混淆矩阵，并检查其准确性，精度，召回率，并绘制ROC曲线，并根据需要找出AUC。但是，如果您的数据集不平衡，请不要使用准确性作为度量。如果您想对模型进行更深入的评估，以使概率分数也得到权重，请选择对数损失。

请记住，请务必评估您的训练！

（编辑：PHP编程网 - 襄阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

与用户双向奔赴私域，	理想未来城市哪止于物
波司登，拿高端化解释	印度裔CEO称霸硅谷，印