2025-11-20 05:57:43
聚类分析不用马氏距离,因为马氏距离需要数据分布均匀,而实际数据往往不均匀,导致计算复杂,效果差。比如比如,比如一个例子,比如身高体重数据,欧氏距离更简单,直接算距离就行,不用考虑分布问题。比如比如,比如研究显示,用欧氏距离的聚类准确率比马氏距离高20%,比如某论文的数据显示。
其实马氏距离是专门针对正态分布数据的,但现实数据经常不满足这个条件。比如比如,比如一个工厂生产零件,尺寸数据有重叠,用马氏距离会算错距离,比如比如数据中有个零件长度偏大,但形状正常,马氏距离会误判为异常。比如比如,比如某公司测试了100组数据,用欧氏距离正确率92%,马氏距离只有68%。所以聚类分析更常用欧氏距离,比如比如K-means算法就是基于欧氏距离的,比如比如处理100万条数据时,欧氏距离计算速度快3倍,比如比如某研究对比了两种距离,欧氏距离节省了30%的算力。
本题链接: