2025-11-12 23:15:47
ROC是评估模型好坏的曲线,横轴是假正率(假阳性比例),纵轴是真正率(实际正类被正确识别的比例)。就像用不同标准判断考试卷对不对,把预测结果从高到低排好队,算出每个标准下的正确和错误情况。比如测试集1000条数据,500条是正类,模型调整阈值后,假正率从0%到100%,真正率可能从30%到80%,连起来就是ROC曲线。
为什么这么画这个曲线?因为模型预测值有高低之分,需要换不同标准看效果。比如分类器预测分数1到10分,1分定为正类时假正率可能0%,真正率30%;5分定为正类时假正率50%,真正率60%;10分定为正类时假正率100%,真正率80%。用100组数据连成曲线,陡峭部分说明模型调整阈值时真正率提升快。比如某模型在假正率40%时真正率75%,另一模型同假正率时真正率65%,说明前者更好。实际测试中,AUC值(曲线下面积)0.92比0.78高,说明前者识别正类能力更强。
本题链接: