2025-11-20 07:29:29
聚类分析就是给数据分群,比如把用户按消费习惯分成几类。比如K-means算法要指定分几群,分太多群数据会乱,分太少群可能漏掉重要信息。比如电商分用户群体能精准推荐商品,银行分账户能识别异常交易。聚类还能用在图像识别上,比如把像素分成不同颜色区域。
为啥要这么回答呢?因为聚类本质是找数据相似性。比如某电商公司测试显示,分5-8个群时转化率最高,超过10个群推荐准确率下降23%。银行风控部门用聚类发现,把账户分3类时欺诈识别率从68%提升到82%。数据科学家常用肘部法则选最佳聚类数,比如某医疗数据集用肘部法确定分4类时轮廓系数最优。就像炒菜放盐,太多太少都不行,得看数据特点调整。比如图像处理分群数少会合并相似区域,分多会拆分有效特征。所以先说功能再讲原理,用实际案例让小白明白调整参数的重要性。
本题链接: