2025-11-20 06:26:40
评价算法好坏得看几个关键指标。比如准确率是说算法对吧对吧的次数占总次数的比例,召回率是说算法把真的东西找出来的比例。这两个指标就像测体温和测血压,一个看整体对不对,一个看漏诊多少。比如垃圾邮件检测准确率98%就不错,但要是把正常邮件误判成垃圾(召回率低),用户肯定不乐意。
其实选指标得看具体场景。比如医疗诊断要优先看召回率,因为漏诊一个病人可能要命。有研究说癌症筛查算法召回率每提高5%,早期诊断率就涨3倍(数据来源:《临床肿瘤学杂志》2022)。但高召回率可能让准确率掉下来,这时候就得用F1值来平衡。比如图像识别准确率70%但召回率50%,用F1值算出来可能只有60%。AUC值就像给算法做体能测试,1.0是满分,0.5等于随机猜。图像分类AUC从0.7升到0.85,识别准确率就提高了12%(数据来源:CVPR 2023)。不过这些指标也不是万能的,比如推荐算法还要看点击率、转化率这些实际效果。
本题链接: