我有59个样本,48个特征,想做一个二分类预测,观察哪些特征对分类贡献比较大。请问大家这个样本量可以做吗?感觉样本量太少
2条回答 默认 最新
关注 理论上可以做,但样本量太少。
首先,你的问题不是很明确,你是聚类问题(59个样本没有分类标记),还是分类问题(59个样本已标记属于那种分类)。
如果是聚类问题,这些特征和样本也是可以做的,只是效果很难说。因为聚类问题的效果没有对错,甚至没有绝对的好坏,只有相对的分类是否合理,是否能明确区隔。基本上就是根据这些特征的某种距离(如欧式距离)来进行聚类,总能得到结果,也没法说分类的结果不好。举个例子,全国 31个省市区,你找多少个特征出来都能找到,分为两类,怎么分都有道理,只是分类的角度不同而已。
如果是分类问题,48个特征相对于 59个样本显然是太多了。建议先做主元素分析,把特征减少到 5~10个,这样就比较好处理了。本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 Pyqt 如何正确的关掉Qthread,并且释放其中的锁?
- ¥30 网站服务器通过node.js部署了一个项目!前端访问失败
- ¥15 WPS访问权限不足怎么解决
- ¥15 java幂等控制问题
- ¥15 海湾GST-DJ-N500
- ¥15 氧化掩蔽层与注入条件关系
- ¥15 Django DRF 如何反序列化得到Python对象类型数据
- ¥15 多数据源与Hystrix的冲突
- ¥15 如何在线硕士了解,广告太多,希望有真实接触过的人回答下?(标签-学习|关键词-在线硕士)
- ¥15 zabbix6.4与frp如何进行联动