长腿猴子请来的救兵 2022-02-27 18:35 采纳率: 100%
浏览 47
已结题

机器学习二分类样本少可以做吗?

我有59个样本,48个特征,想做一个二分类预测,观察哪些特征对分类贡献比较大。请问大家这个样本量可以做吗?感觉样本量太少

  • 写回答

2条回答 默认 最新

  • youcans_ 人工智能领域优质创作者 2022-02-27 20:31
    关注

    理论上可以做,但样本量太少。
    首先,你的问题不是很明确,你是聚类问题(59个样本没有分类标记),还是分类问题(59个样本已标记属于那种分类)。
    如果是聚类问题,这些特征和样本也是可以做的,只是效果很难说。因为聚类问题的效果没有对错,甚至没有绝对的好坏,只有相对的分类是否合理,是否能明确区隔。基本上就是根据这些特征的某种距离(如欧式距离)来进行聚类,总能得到结果,也没法说分类的结果不好。举个例子,全国 31个省市区,你找多少个特征出来都能找到,分为两类,怎么分都有道理,只是分类的角度不同而已。
    如果是分类问题,48个特征相对于 59个样本显然是太多了。建议先做主元素分析,把特征减少到 5~10个,这样就比较好处理了。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月14日
  • 已采纳回答 3月6日
  • 创建了问题 2月27日

悬赏问题

  • ¥15 stm32开发clion时遇到的编译问题
  • ¥15 lna设计 源简并电感型共源放大器
  • ¥15 如何用Labview在myRIO上做LCD显示?(语言-开发语言)
  • ¥15 Vue3地图和异步函数使用
  • ¥15 C++ yoloV5改写遇到的问题
  • ¥20 win11修改中文用户名路径
  • ¥15 win2012磁盘空间不足,c盘正常,d盘无法写入
  • ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
  • ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
  • ¥15 帮我写一个c++工程