考虑区域Z,其中0≤x <1,0≤y <1。考虑Z→{true,false}的二元类分类问题。
假设如果x <0.5则为true,如果x> = 0.5则为false。
作为训练数据,从真实范围中随机选择n个点,从错误范围中随机选择n个点。
作为泛化性能,从Z中随机选择100个点,并获得估计结果与真实值之间的匹配率。
(1)当n = 2时,尝试100次实验得出1-NN的泛化性能。(匹配率的平均值和标准偏差。
(2)当n = 10时,尝试100次试验以找出1-NN的泛化性能。(匹配率的平均值和标准偏差。
(3)假设n = 10,但十分之一是噪声。
此时,比较1-NN的泛化性能和3-NN的泛化性能。尝试100次表示出结果。
求相关设计思路和代码