2025-11-20 05:37:57
使用roc和auc评价分类器,是因为它们能全面反映模型在不同阈值下的表现。比如准确率80%的模型,召回率可能只有50%,而AUC0.9的模型,两者都高,说明更可靠。ROC曲线连起来,横轴是假阳性,纵轴是假阴性,下面积越大越好,说明模型越准。AUC值接近1,说明模型能更好区分正负样本,接近0.5就像抛随机猜。
为什么选roc和auc呢?因为分类器好坏不能只看单一指标,比如准确率高可能因为数据不平衡。比如某模型在正负样本各1000个时,准确率90%但漏掉500个正样本,召回率只有50%。而AUC0.85的模型,在调整阈值后,召回率能到70%,假阳性也控制得更好。数据证明,AUC每提高0.1,误判率下降约15%。比如医疗诊断中,AUC0.92的模型比0.75的,把真患者漏掉的概率减少一半,同时假报警减少30%。所以用这两个指标,能更客观比较模型,避免单一数据误导。
本题链接: