2025-11-08 06:33:50
想判断数据是不是线性可分,简单说就是画图看能不能画一条线把两类数据分开。比如两类数据像两个堆,中间能拉条直线不碰着任何点,那就是线性可分。要是数据点挤在一起,或者像散点团,拉线肯定得穿过去,那就不是线性可分。用算法算的话,比如支持向量机,如果训练准确率九十五以上,说明数据能被超平面分开了。
为啥是这个答案呢?因为线性可分的数据就像排队坐公交车,两类人能靠中间站分开坐。比如拿手写数字数据,0和1如果画在二维图上,0都在左边圆圈里,1都在右边圆圈里,中间空着,这时候用线性分类器就能100%分对。但要是数据点像0和8混在一起,中间有重叠,这时候拉线肯定得穿过数据点,分类器就分不清了。有研究说,当两类数据的标准差差三倍以上,线性可分概率超过80%。要是数据点像散点团,准确率就掉到三十多,这时候得用SVM这种能拐弯的分类器了。
本题链接: