千寻原风景 2017-04-01 13:14 采纳率: 0%
浏览 8

华老师,您好,请问在分类问题的建模过程中数据是非均衡的以及有噪点时该如何处理呢?

通过改变类别的权重会有效果吗?另外PCA降维和SVD之类的对于处理噪点有帮助吗?还请老师指点一二,谢谢!

  • 写回答

1条回答 默认 最新

  • wa2003 2017-04-04 06:16
    关注

    如果有偏离正常值很远的噪点,则可以通过异常点检测算法来检测。另外也可以考虑滤波算法将数据通过一个滤波器。

    如果是类别不平衡问题,那么一般需要考虑降采样,从而平衡类别的比例。改变类别的权重的本质是算法偏好的取舍:你的算法倾向于选择权重较大的类别。

    PCA 降维之类的算法只是将数据从高维降低到低维空间,它并没有增加或者减少样本数据。但是如果你的噪点与正常点在低纬空间的投影重合的,那么噪点就被正常点给掩盖住了。所以PCA降维之类的算法,对于噪点问题,至少它没有坏处。

    评论

报告相同问题?

悬赏问题

  • ¥30 win from 窗口最大最小化,控件放大缩小,闪烁问题
  • ¥20 易康econgnition精度验证
  • ¥15 msix packaging tool打包问题
  • ¥28 微信小程序开发页面布局没问题,真机调试的时候页面布局就乱了
  • ¥15 python的qt5界面
  • ¥15 无线电能传输系统MATLAB仿真问题
  • ¥50 如何用脚本实现输入法的热键设置
  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致