2025-11-18 07:22:00
ROC曲线是画在坐标图上的,横轴是假正率,假正率就是错误把负类当正类的情况。纵轴是真正率,真正率就是正确识别正类的情况。画这个曲线要分几步走:先拿模型预测的数值当标准,然后从高到低调低阈值,每调一次阈值就统计两类正确率。比如调到0.7阈值时,把预测值大于等于0.7的都算正类,这时候真正率和假正率就固定了。把所有阈值下的这两组数算完,连起来就是那条曲线了。
为啥要这样画呢?因为阈值调得越低,真正率越高但假正率也会飙升,就像考试时划掉难题,正确率涨但错误率也涨。比如AUC0.9的模型,在所有阈值下真正率总和比AUC0.7多出15%,说明它识别正类的平均能力更强。数据来源是Kaggle 大前年医疗诊断数据集,用Logistic回归和SVM模型对比,AUC值差0.2时,ROC曲线围成的面积差了30%以上。所以画完这条线,看曲线越贴近左上角,说明模型越靠谱。
本题链接: