咨询大家一个问题,我的特征集里有很多特征,一些特征是独立的,一些是相关的一组,比如一个时间段的数据,我应该如何进行特征筛选?
举例:
[
[特征1(独立),特征2(独立),特征3(前1天特征X),特征4(前2天特征X),特征5(前1天特征Y),特征6(前2天特征Y)],.....
......
]
其中特征1和2是独立的,这个应该好进行筛选,特征3和4是相关的,特征5和6是相关的,我应该什么特征选取的方法,才能将3和4看做一组,5和6看成一组,进行筛选和保留?
另外,相同的一组特征,比如特征3和特征4,我在组织数据的时候,是否可以分散开进行组织,然后还是按照组形式筛选保留?