【零基础学机器学习 13】 混淆矩阵 最佳指南以及代码实战( 二 )


召回率():用于计算模型预测正值的能力 。即“模型正确预测正值的频率是多少?” 。它是真正值除以实际正值的总数 。
R e c a l l = T P / ( T P + F N )= TP / (TP + FN) =TP/(TP+FN)
在这种情况下:
= 86 / (86 + 10) = 0.8983 = 89.83%
F1-Score
F1-Score:它是精确率和召回率的调和平均数 。当需要同时考虑精确率和召回率时,它很有用 。
F 1 值( F 1 ? s c o r e ) = 2 ? P r e c i s i o n ? R e c a l l / ( P r e c i s i o n + R e c a l l ) F1值(F1-score)= 2 **/ ( + ) F1值(F1?score)=2??/(+)
在这种情况下:
F1-Score = (2* 0.8775 * 0.8983) / (0.8775 + 0.8983) = 0.8877 = 88.77%
错误率 - Error Rate
错误率(Error Rate):分类器错误预测的样本数占总样本数的比例 。
E r r o r R a t e = ( F P + F N ) / ( T P + F P + T N + F N ) Error Rate = (FP + FN) / (TP + FP + TN + FN) =(FP+FN)/(TP+FP+TN+FN)
在这种情况下:
Error Rate = (12 + 10) / (86 + 12 + 79 + 10) = 0.1176
特异度 -
特异度():真正为负例的样本中,分类器正确预测为负例的样本数占真正为负例的样本数的比例 。
S p e c i f i c i t y = T N / ( T N + F P )= TN / (TN + FP) =TN/(TN+FP)
在这种情况下:
= 79 / (79 + 12) = 0.8681
假正率 - FalseRate

【零基础学机器学习 13】 混淆矩阵 最佳指南以及代码实战

文章插图
假正率(FalseRate):真正为负例的样本中,分类器错误预测为正例的样本数占真正为负例的样本数的比例 。
F a l s e P o s i t i v e R a t e = F P / ( T N + F P ) FalseRate = FP / (TN + FP) =FP/(TN+FP)
在这种情况下:
FalseRate= 12 / (79 + 12) = 0.1318
假负率 - FalseRate
假负率(FalseRate):真正为正例的样本中,分类器错误预测为负例的样本数占真正为正例的样本数的比例 。
F a l s e N e g a t i v e R a t e = F N / ( T P + F N ) FalseRate = FN / (TP + FN) =FN/(TP+FN)
在这种情况下:
FalseRate= 10 / (86 + 10) = 0.1041
真正率 - TrueRate
真正率(TrueRate):同召回率 。
T r u e P o s i t i v e R a t e = T P / ( T P + F N ) TrueRate = TP / (TP + FN) =TP/(TP+FN)
在这种情况下:
TrueRate= 86 / (86 + 10) = 0.8958
预测正例率 -Value
预测正例率(Value):同精确率 。
【【零基础学机器学习 13】 混淆矩阵 最佳指南以及代码实战】P o s i t i v e P r e d i c t i v e V a l u e = T P / ( T P + F P )Value= http://www.kingceram.com/post/TP / (TP + FP) lue=TP/(TP+FP)
在这种情况下:
Value= http://www.kingceram.com/post/86 / (86 + 12) = 0.8775
预测负例率 -Value
预测负例率(Value):真正为负例的样本中,分类器正确预测为负例的样本数占预测为负例的样本数的比例 。
N e g a t i v e P r e d i c t i v e V a l u e = T N / ( T N + F N )Value= http://www.kingceram.com/post/TN / (TN + FN) lue=TN/(TN+FN)
在这种情况下:
Value= http://www.kingceram.com/post/79 / (79 + 10) = 0.8876
假发现率 - FalseRate
假发现率(FalseRate):同1-精确率 。
F a l s e D i s c o v e r y R a t e = F P / ( F P + T P ) FalseRate = FP / (FP + TP) =FP/(FP+TP)
在这种情况下:
FalseRate= 12 / (12 + 86) = 0.1224
用预测心脏病
我们将使用心脏病发作数据集构建一个逻辑回归模型,以预测患者是否有心脏病发作的风险 。
数据集
下图展示了我们将在此演示中使用的数据集 。
age:患者的年龄sex:患者的性别(1 = 男性,0 = 女性)cp:胸痛类型(值为0、1、2、3,分别表示不同类型的胸痛):患者在休息状态下的收缩压(毫米汞柱)chol:患者的胆固醇水平(毫克/分升)fbs:空腹血糖(1 = 空腹血糖 > 120 mg/dl,0 = 空腹血糖