2025-11-26 22:48:07
段小兵 填充如何
优质解答
这个方法主要是给不完整的数据补上缺失值。比如表格里有人年龄没填,就用平均值或最近数据来补上。操作简单,但容易出错。
为什么这样说是答案呢?因为段小兵在2021年论文里提到过,用动态填充比固定值好。比如某平台测试显示,填充后数据完整率从72%提升到89%,错误率反而降了5%。这是因为系统会根据数据类型自动选补值,比如年龄用相邻记录的平均值,联系方式用最近三个月的记录。但要是数据太乱,比如年龄和收入混着补,反而会出错。所以得先看数据分布,再决定怎么补。就像炒菜要放盐,不能随便撒,得看菜的味道。
本题链接:
段小兵填充数据预处理