m0_52584457 2022-04-09 11:14 采纳率: 66.7%
浏览 132
已结题

利用tsfresh进行数据特征提取后过滤特征时报错,如何解决?(语言-python)

问题遇到的现象和发生背景

想用tsfresh进行数据的特征提取,构造好时序数据后成功提取特征,但是进行特征过滤时出现报错,

img


推测是设置标签集的时候出现问题了,下图中有正确的标签和我设置的标签集
正确的

img


我的

img


不知道是我数据有问题还是标签集设置的有问题
#正确的结果

img

问题相关代码,请勿粘贴截图

代码
#导入模块和数据
import pandas as pd
import numpy as np
timeseries_csv= pd.read_csv('C:\Users\12084\Desktop\课题\20210108mosunhemoca.csv',engine='python')
timeseries_csv.describe()
#数据集标签
y_csv = pd.read_csv('C:\Users\12084\Desktop\课题\数据1.csv',usecols = ['time','F_x'],engine='python')
y_csv= pd.Series(np.array(y_csv['F_x']).tolist(),index =np.array(y_csv['time']).tolist())
y_csv.head()
#提取特征
from tsfresh.feature_extraction import extract_features
extracted_features_0 = extract_features(timeseries_csv, column_id="id", column_sort="time")
extracted_features_0.shape
#特征过滤
from tsfresh import select_features
from tsfresh.utilities.dataframe_functions import impute
impute(extracted_features_0 )
extracted_features_0 = select_features(extracted_features_0, y_csv)#报错
extracted_features_0 .shape

运行结果及报错内容

#报错内容

AssertionError: X and y must contain the same number of samples.

我的解答思路和尝试过的方法

我尝试改变数据集标签的类型,但是都失败了。上述代码中过滤特征的原理就是根据和原数据集的相关度把没用的特征过滤掉

我想要达到的结果

正确设置标签集且成功将多余特征过滤掉

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2022-04-13 09:48
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,已经为您补发到账户,我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。

    评论

报告相同问题?

问题事件

  • 系统已结题 4月17日
  • 创建了问题 4月9日

悬赏问题

  • ¥15 乘性高斯噪声在深度学习网络中的应用
  • ¥15 运筹学排序问题中的在线排序
  • ¥15 关于docker部署flink集成hadoop的yarn,请教个问题 flink启动yarn-session.sh连不上hadoop,这个整了好几天一直不行,求帮忙看一下怎么解决
  • ¥30 求一段fortran代码用IVF编译运行的结果
  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥30 python代码,帮调试,帮帮忙吧