下载此文档

ROC曲线-阈值评价标准.doc


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
ROC曲线指受试者工作特征曲线/接收器操作特性曲线(urve),是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。在ROC曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。ROC曲线的例子考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被预测成正类,即为真正类(Truepositive),如果实例是负类被预测成正类,称之为假正类(Falsepositive)。相应地,如果实例是负类被预测成负类,称之为真负类(Truenegative),正类被预测成负类则为假负类(falsenegative)。TP:正确肯定的数目;FN:漏报,没有正确找到的匹配的数目;FP:误报,给出的匹配是不正确的;TN:正确拒绝的非匹配对数; 列联表如下表所示,1代表正类,0代表负类。  预测   10合计实际1TruePositive(TP)FalseNegative(FN)ActualPositive(TP+FN) 0FalsePositive(FP)TrueNegative(TN)ActualNegative(FP+TN)合计 PredictedPositive(TP+FP)PredictedNegative(FN+TN)TP+FP+FN+TN从列联表引入两个新名词。其一是真正类率(truepositiverate,TPR),计算公式为TPR=TP/(TP+ FN),刻画的是分类器所识别出的正实例占所有正实例的比例。另外一个是负正类率(falsepositiverate,FPR),计算公式为FPR=FP/(FP+TN),计算的是分类器错认为正类的负实例占所有负实例的比例。还有一个真负类率(TrueNegativeRate,TNR),也称为specificity,计算公式为TNR=TN/(FP+ TN)=1-FPR。其中,两列Truematches和Truenon-match分别代表应该匹配上和不应该匹配上的两行Predmatches和Prednon-match分别代表预测匹配上和预测不匹配上的在一个二分类模型中,对于所得到的连续结果,假设已确定一个阀值,,大于这个值的实例划归为正类,小于这个值则划到负类中。如果减小阀值,,固然能识别出更多的正类,也就是提高了识别出的正例占所有正例的比类,即TPR,但同时也将更多的负实例当作了正实例,即提高了FPR。为了形象化这一变化,在此引入ROC,ROC曲线可以用于评价一个分类器。ROC曲线和它相关的比率(a)理想情况下,TPR应该接近1,FPR应该接近0。ROC曲线上的每一个点对应于一个threshold,对于一个分类器,每个threshold下会有一个TPR和FPR。比如Threshold最大时,TP=FP=0,对应于原点;Threshold最小时,TN=FN=0,对应于右上角的点(1,1)(b)P和N得分不作为特征间距离d的一个函数,随着阈值theta增加,TP和FP都增加 ReceiverOperatingCharact

ROC曲线-阈值评价标准 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人changjinlai
  • 文件大小104 KB
  • 时间2020-08-17
最近更新