为什么我的csv文件中有close列还跟我报错说没有close列

在我的D盘下的data.csv文件中是有close列的，为什么jupyter跟我报错说data.csv文件中没有close这一列

import pandas as pd
 
df = pd.read_csv('D:/data.csv')
df.rename(columns={"Date": "date", "Open": "open", "High": "high", "Low": "low", "Close": "close", "Volume": "volume"}, inplace=True)
df.set_index('date', inplace=True)
df.sort_values(by='date', inplace=True)
 
def Stock_Price_LSTM_Data_Precesing(df,mem_his_days,pre_days):
    df.dropna(inplace=True)
    df.sort_index(inplace=True)
    df['label']= df['Close'].shift(-pre_days)
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    sca_X=scaler.fit_transform(df.iloc[:,:-1])   
    mem_his_days = 10
    
    from collections import deque
    deq = deque(maxlen=mem_his_days)
    
    X = []
    for i in sca_X:
        deq.append(list(i))
        if len(deq)==mem_his_days:
            X.append(list(deq))
    X_lately = X[-pre_days:]
    X = X[:-pre_days]
    y = df['label'].values[mem_his_days-1:-pre_days]
    
    
    import numpy as np
    X = np.array(X)
    y = np.array(y)
    return X,y,X_lately
 
X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,5,10)
print(len(X))
print(len(y))
print(len(X_lately))
 
pre_days = 10
mem_days=[5,10,15]
lstm_layers=[1,2,3]
dense_layers=[1,2,3]
units = [16,32]
 
from tensorflow.keras.callbacks import ModelCheckpoint
 
for the_mem_days in mem_days:
    for the_lstm_layers in lstm_layers:
        for the_dense_layers in dense_layers:
            for the_units in units:
                filepath="./minedata/{val_mape:.2f}_{epoch:02d}_men_1_lstm_1_dense_1_unit_16.weights.h5"
                checkpoint = ModelCheckpoint(
                    filepath=filepath,
                    save_weights_only=True,
                    monitor='val_mape',
                    mode='min',
                    save_best_only=True)
                X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,the_mem_days,pre_days)
                from sklearn.model_selection import train_test_split
                X_train,X_test,y_train,y_test = train_test_split(X,y,shuffle=False,test_size=0.1)
                import tensorflow as tf
                from tensorflow.keras.models import Sequential
                from tensorflow.keras.layers import LSTM,Dense,Dropout
                model = Sequential()
                model.add(LSTM(the_units,input_shape=X.shape[1:],activation='relu',return_sequences=True))
                model.add(Dropout(0.1))
                for i in range(the_lstm_layers):
                    model.add(LSTM(the_units,activation='relu',return_sequences=True))
                    model.add(Dropout(0.1))
                
                model.add(LSTM(the_units,activation='relu'))
                model.add(Dropout(0.1))
                for i in range(the_dense_layers):
                    model.add(Dense(the_units,activation='relu'))
                    model.add(Dropout(0.1))
                
                model.add(Dense(1))
                model.compile(optimizer='adam',
                             loss='mse',
                             metrics=['mape'])
                model.fit(X_train,y_train,batch_size=32,epochs=50,validation_data=(X_test,y_test),callbacks=[checkpoint])

这是错误报告

KeyError                                  Traceback (most recent call last)
File D:\anaconda\Lib\site-packages\pandas\core\indexes\base.py:3791, in Index.get_loc(self, key)
   3790 try:
-> 3791     return self._engine.get_loc(casted_key)
   3792 except KeyError as err:

File index.pyx:152, in pandas._libs.index.IndexEngine.get_loc()

File index.pyx:181, in pandas._libs.index.IndexEngine.get_loc()

File pandas\_libs\hashtable_class_helper.pxi:7080, in pandas._libs.hashtable.PyObjectHashTable.get_item()

File pandas\_libs\hashtable_class_helper.pxi:7088, in pandas._libs.hashtable.PyObjectHashTable.get_item()

KeyError: 'Close'

The above exception was the direct cause of the following exception:

KeyError                                  Traceback (most recent call last)
Cell In[6], line 35
     32     y = np.array(y)
     33     return X,y,X_lately
---> 35 X,y,X_lately = Stock_Price_LSTM_Data_Precesing(df,5,10)
     36 print(len(X))
     37 print(len(y))

Cell In[6], line 11, in Stock_Price_LSTM_Data_Precesing(df, mem_his_days, pre_days)
      9 df.dropna(inplace=True)
     10 df.sort_index(inplace=True)
---> 11 df['label']= df['Close'].shift(-pre_days)
     12 from sklearn.preprocessing import StandardScaler
     13 scaler = StandardScaler()

File D:\anaconda\Lib\site-packages\pandas\core\frame.py:3893, in DataFrame.__getitem__(self, key)
   3891 if self.columns.nlevels > 1:
   3892     return self._getitem_multilevel(key)
-> 3893 indexer = self.columns.get_loc(key)
   3894 if is_integer(indexer):
   3895     indexer = [indexer]

File D:\anaconda\Lib\site-packages\pandas\core\indexes\base.py:3798, in Index.get_loc(self, key)
   3793     if isinstance(casted_key, slice) or (
   3794         isinstance(casted_key, abc.Iterable)
   3795         and any(isinstance(x, slice) for x in casted_key)
   3796     ):
   3797         raise InvalidIndexError(key)
-> 3798     raise KeyError(key) from err
   3799 except TypeError:
   3800     # If we have a listlike key, _check_indexing_error will raise
   3801     #  InvalidIndexError. Otherwise we fall through and re-raise
   3802     #  the TypeError.
   3803     self._check_indexing_error(key)

KeyError: 'Close'

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-28 21:14
关注
引自免费微信小程序：皆我百晓生

看起来你在尝试从CSV文件中读取数据并进行预处理，但是在执行df['label'] = df['Close'].shift(-pre_days)这行代码时遇到了KeyError: 'Close'的错误。这个错误意味着在DataFrame df 中找不到名为 'Close' 的列。

为了解决这个问题，我们需要确保你的CSV文件确实包含名为 'Close' 的列。你可以通过简单地检查CSV文件内容或者在加载数据后打印DataFrame的列名来确认这一点。

首先，确保你的CSV文件中确实有 'Close' 这一列。然后，如果你仍然遇到问题，可能是数据加载过程中出现了问题。可以试着不进行重命名操作，先直接加载原始CSV文件，看是否能正确读取到 'Close' 列。以下是简化版的代码，用于加载CSV文件并检查列名：

import pandas as pd # 加载CSV文件，不进行列名重命名 df = pd.read_csv('D:/data.csv') # 打印DataFrame的列名 print(df.columns)

运行这段代码后，你应该能看到所有列名。如果 'Close' 不在这个列表里，那么你需要检查CSV文件本身，确保它包含了正确的列名。如果 'Close' 在列表里，但还是报错，那可能是在后续处理中发生了意外的列删除或重命名。请确保在进行任何列操作之前，例如重命名、删除或排序， 'Close' 列都存在。

如果问题依然存在，请提供更详细的CSV文件样本以及完整的列名输出，这样我可以更好地协助你找到问题所在。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

R语言报错“Cannot allocate vector“？大数据集的chunk处理模式
2025-11-13 08:26

喜欢编程就关注我的博客本文系统介绍了R语言处理大数据集时"内存分配失败"错误的解决方案。首先分析了错误成因包括物理内存限制、碎片化和虚拟内存不足，并提供了诊断工具。核心解决方案是chunk分块处理模式，包括文件分块读取和...
python打开csv文件乱码_解决Python2.7读写文件中的中文乱码问题
2020-11-24 05:38

weixin_39644377的博客 Python2.7对于中文编码的问题处理的并不好，这几天在爬数据的时候经常会遇到中文的编码问题。但是本人对编码原理不了解，也没时间深究其中的原理。...当然，编程中遇到具体问题还需具体分析啦。#encoding:ut...
Python DAY 14 异常处理&文件操作&复制文件&CSV文件读写
2020-08-06 19:34

Galahad_Lin的博客 CSV文件读写一异常处理错误： Error 异常： Exception 错误实例： 1a = 10 # SyntaxError: invalid syntax 无效的语法即语法错误 print(a) # NameError: name 'a' is not defined 变量没有定义 [][0] # ...
Python编程语言入门
2023-08-09 03:55

光子AI的博客本文首先对Python编程语言进行了介绍，然后详细阐述Python中的一些重要概念及术语，并着重描述了Python的一些核心算法原理和具体操作步骤。最后，在最后给出一些示例代码，展示Python的强大功能，并指出Python与其他...
Python学习笔记-文件操作与CSV格式
2024-05-28 11:26

qijinbo0312的博客程序中的数据都存储在内存中，当程序执行完毕后，内存中的数据将丢失。文件可以用来进行数据的长期保存。
python基础文件读写教程
2024-01-16 18:29

在Python编程语言中，文件读写是日常开发中不可或缺的一部分，无论是处理用户数据、日志记录还是配置文件，都需要对文件进行操作。本教程将深入浅出地介绍Python中的基本文件读写方法，并通过实际案例让你快速掌握...
r语言新增一列数字类型_R语言数据处理120题，终于有人来照顾用R的孩子了
2020-10-17 14:53

weixin_39683176的博客但由于R语言和Pandas有部分差别较大，在尽量不修改原题的基础上制作完成。本项目包含基础、基本数据处理、金融数据处理、科学计算、补充内容 5个部分。一共涵盖了数据处理、计算、可视化等常用操作，并对部分题目给...
csv多余逗号写入文件的解决方案
2020-09-23 14:08

爱编程的喵喵的博客使用with open(file) as f: f.write时可能会保存成csv文件，csv文件是以逗号隔开的，假如某句话也含有逗号，会导致读取时失败，为避免上述情况，可使用csv库进行保存 final_path = 'res.txt' f = open(final_path, '...
Python批量将csv文件的编码方式转换为UTF-8
2022-04-11 22:35

牧文山的博客当我们用pandas是操作CSV文件的时候，常常会因为编码问题出现报错。下面我们用Python编写一个程序，用来批量转换csv文件的编码方式。
python程序设计--CSV文件操作
2024-07-01 19:11

无所谓的菜鸟的博客我们首先用字典去存储各个学生的信息，然后将字典存储到一个列表里，当我们打开文件时，就可以选择去输出学生信息或者更改或删除学生信息都可以，然而在代码实现的过程中并不是一帆风顺的，小编我也遇到了很多问题。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月28日

为什么我的csv文件中有close列还跟我报错说没有close列

4条回答 默认 最新

问题事件

4条回答默认最新