加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 襄阳站长网 (https://www.0710zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

如何评估机器学习模型的性能

发布时间:2020-09-26 12:05:12 所属栏目:创业 来源:网络整理
导读:副标题#e# 您可以整天训练有监督的机器学习模型,但是除非您评估其性能,否则您永远无法知道模型是否有用。这个详细的讨论回顾了您必须考虑的各种性能指标,并对它们的含义和工作方式提供了直观的解释。 为什么需要评估? 让我从一个非常简单的例子开始。

通过使用以下公式计算   残差平方 和,即所有误差(e_i)平方的总和,   其中fi是第i个数据点的模型的预测目标值。

如何评估机器学习模型的性能

取所有实际目标值的平均值:

然后计算与测试集目标值的方差成正比的   总平方和 :

如何评估机器学习模型的性能

如果同时观察两个平方和的公式,则可以看到唯一的区别是第二项,即y_bar和fi。平方总和在某种程度上给我们一种直觉,即它仅与残差平方和相同,但预测值为[,,,…….,n次]。是的,您的直觉是正确的。假设有一个非常简单的均值模型,无论输入数据如何,均能每次预测目标值的平均值。

现在我们将R²表示为:

正如您现在所看到的,R²是一种度量,用于将模型与非常简单的均值模型进行比较,该均值模型每次均返回目标值的平均值,而与输入数据无关。比较有4种情况:

情况1:SS_R = 0

(R²= 1)完美的模型,完全没有错误。

情况2:SS_R> SS_T

(R²<0)模型甚至比简单的均值模型差。

情况3:SS_R = SS_T

(R²= 0)模型与简单均值模型相同。

情况4:SS_R <SS_T

(0 <R²<1)模型还可以。

因此,简而言之,您应该非常了解您的数据集和问题,然后您始终可以创建一个混淆矩阵,并检查其准确性,精度,召回率,并绘制ROC曲线,并根据需要找出AUC。但是,如果您的数据集不平衡,请不要使用准确性作为度量。如果您想对模型进行更深入的评估,以使概率分数也得到权重,请选择对数损失。

请记住,请务必评估您的训练!

 

(编辑:PHP编程网 - 襄阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读