pandas时间序列索引报错的问题

    #执行以下代码没有问题    
    ts_data_load= pd.read_csv(os.path.join(data_dir, "energy.csv"), parse_dates=["timestamp"] )

    # Reindex the dataframe such that the dataframe has a record for every time point
    # between the minimum and maximum timestamp in the time series. This helps to
    # identify missing time periods in the data (there are none in this dataset).
    ts_data_load.index = ts_data_load["timestamp"]
    ts_data_load = ts_data_load .reindex( pd.date_range(min(energy["timestamp"]), max(energy["timestamp"]), freq="H")  )
    ts_data_load= ts_data_load .drop("timestamp", axis=1)
    ts_data_load = load_data(data_dir)[["load"]]
    ts_data_load.head()
    #输出结果

load
2012-01-01 00:00:00 2,698.00
2012-01-01 01:00:00 2,558.00
2012-01-01 02:00:00 2,444.00
2012-01-01 03:00:00 2,402.00
2012-01-01 04:00:00 2,403.00

#执行下面这句代码，输出正常  
ts_data_load.index

#输出结果
DatetimeIndex(['2012-01-01 00:00:00', '2012-01-01 01:00:00',
               '2012-01-01 02:00:00', '2012-01-01 03:00:00',
               '2012-01-01 04:00:00', '2012-01-01 05:00:00',
               '2012-01-01 06:00:00', '2012-01-01 07:00:00',
               '2012-01-01 08:00:00', '2012-01-01 09:00:00',
               ...
               '2014-12-31 14:00:00', '2014-12-31 15:00:00',
               '2014-12-31 16:00:00', '2014-12-31 17:00:00',
               '2014-12-31 18:00:00', '2014-12-31 19:00:00',
               '2014-12-31 20:00:00', '2014-12-31 21:00:00',
               '2014-12-31 22:00:00', '2014-12-31 23:00:00'],
              dtype='datetime64[ns]', length=26304, freq='H')

    #如果执行下面这句代码，就报错
    ts_data_load['2012-06-01']
    #报错，请问这是什么原因？？谢谢

KeyError Traceback (most recent call last)
File d:\ProgramData\anaconda3\Lib\site-packages\pandas\core\indexes\base.py:3653, in Index.get_loc(self, key)
3652 try:
-> 3653 return self._engine.get_loc(casted_key)
3654 except KeyError as err:

File d:\ProgramData\anaconda3\Lib\site-packages\pandas_libs\index.pyx:147, in pandas._libs.index.IndexEngine.get_loc()

File d:\ProgramData\anaconda3\Lib\site-packages\pandas_libs\index.pyx:176, in pandas._libs.index.IndexEngine.get_loc()

File pandas_libs\hashtable_class_helper.pxi:7080, in pandas._libs.hashtable.PyObjectHashTable.get_item()

File pandas_libs\hashtable_class_helper.pxi:7088, in pandas._libs.hashtable.PyObjectHashTable.get_item()

KeyError: '20120601'

The above exception was the direct cause of the following exception:

KeyError Traceback (most recent call last)
Cell In[33], line 1
----> 1 ts_data_load['20120601']

File d:\ProgramData\anaconda3\Lib\site-packages\pandas\core\frame.py:3761, in DataFrame.getitem(self, key)
3759 if self.columns.nlevels > 1:
3760 return self._getitem_multilevel(key)
-> 3761 indexer = self.columns.get_loc(key)
3762 if is_integer(indexer):
3763 indexer = [indexer]

File d:\ProgramData\anaconda3\Lib\site-packages\pandas\core\indexes\base.py:3655, in Index.get_loc(self, key)
3653 return self._engine.get_loc(casted_key)
3654 except KeyError as err:
-> 3655 raise KeyError(key) from err
3656 except TypeError:
3657 # If we have a listlike key, _check_indexing_error will raise
3658 # InvalidIndexError. Otherwise we fall through and re-raise
3659 # the TypeError.
3660 self._check_indexing_error(key)

KeyError: '20120601'

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
GISer Liu 2024-03-05 11:34
关注
该回答引用自GPT-3.5,由博主GISer Liu编写：

根据问题描述，报错信息显示KeyError: '20120601'，这意味着在尝试使用ts_data_load['20120601']这样的语法时发生了错误，因为该索引值无法在DataFrame中找到。问题的根本原因是尝试使用字符串``` '20120601'

解决方案如下： 1. **索引时使用时间戳对象而不是字符串** ：确保使用正确的时间戳对象进行索引，而不是字符串。在pandas中，使用``` pd.Timestamp('2012-06-01') ```来表示时间戳对象。 2. **转换索引为时间戳对象** ：在读取CSV文件后，将DataFrame的索引转换为时间戳对象，以便正确地使用时间戳进行索引。下面是解决问题的具体代码： pythonCopy code

确保正确导入所需的库

import pandas as pd
import os

读取CSV文件，确保parse_dates参数正确解析时间戳列

ts_data_load = pd.read_csv(os.path.join(data_dir, "energy.csv"), parse_dates=["timestamp"])

将索引转换为时间戳对象

ts_data_load.index = pd.to_datetime(ts_data_load["timestamp"])

删除'timestamp'列，因为索引已经包含了这个信息

ts_data_load = ts_data_load.drop("timestamp", axis=1)

现在可以使用时间戳对象进行索引

例如，获取2012年6月1日的数据

ts_data_load.loc['2012-06-01']

或者使用pd.Timestamp('2012-06-01')进行索引

ts_data_load.loc[pd.Timestamp('2012-06-01')]

```
以上代码会正确地索引到2012年6月1日的数据，避免了报错。
这样的修改可以确保代码在进行时间序列数据索引时不会出现错误，并且能够按预期工作。

如果该回答解决了您的问题，请采纳！如果没有，请参考以下方案进行修订
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

pandas_alive执行报错，折腾半天了没搞定 python 开发语言
2021-08-08 14:23

回答 1 已采纳报错意思是连接被拒绝
pandas，索引存在。读取报错 python
2018-12-23 11:47

回答 1 已采纳 pandas 是从0行开始的，所以each.index=4096所以最后一行行号是4095，RangeIndex(start=4095, stop=8192, step=1)
python编程中关于pandas 读取xlsx文件的报错问题 python
2020-12-17 21:23

回答 1 已采纳把那个 \ 去掉试试
Python之Pandas读写文件及索引操作
2023-04-02 17:43

八秒记忆的老男孩的博客使用Pandas做数据分析时，需要读取事先准备好的数据集，这是做数据分析的第一步。read_csv()用于读取文本文件，read_json()用于读取json文件，read_sql_query()读取sql语句的。
Pandas 读取CSV文件报错求大神们救命 python 有问必答
2021-10-24 11:15

回答 1 已采纳读取csv文件用read_csv,不是read_excel,同时路径不要用单反斜杠，用“/"或在路径字符串前加个r，不转义就可以了
pandas索引问题 python
2022-08-18 14:03

回答 2 已采纳 emmm这个和索引有关系吗？
关于python中pandas索引取值问题 flask python 有问必答
2021-03-27 12:12

回答 5 已采纳修改了一下代码，看看这个是不是你要的 Order = pd.read_csv('Order.csv', header=None, names=['date', 'time', 'city', 'i
【玩转pandas系列】pandas加载数据，分箱操作和时间序列，绘制图形
2023-08-07 09:14

向阳花花花花的博客本文主要讲解pandas加载数据，分箱操作以及时间序列，绘制各种图形。
安装pandas_profiling报错，如何解决？(语言-python) python
2021-12-21 16:07

回答 1 已采纳版本问题，你去https://pypi.org/
pandas库的dataframe索引问题 python
2021-06-23 08:46

回答 1 已采纳什么错误？n转换为int了吗
pandas的查询问题，需要两列索引 python
2022-03-10 10:17

回答 2 已采纳 import pandas as pd data =[['00001.sz', '20220302', 15.68], ['00001.sz', '20220224', 15.91],
Python 教学 | Pandas 时间数据处理方法
2023-08-02 11:40

企研数据的博客本期我们就来学习如何在 Pandas 中处理时间类型数据。本教程基于 pandas 1.5.3 版本书写。
pandas删除查找索引指定行数 jupyter python 有问必答
2021-11-04 13:30

回答 1 已采纳没有看懂你的问题，但是这个应该能给你解决方法。我用#CSDN#这个app发现了有技术含量的博客，小伙伴们求同去《学习pandas，这一篇文章就够了！》, 一起来围观吧
import pandas as pd 报错_Python数据分析库之pandas，你该这么学！No.1
2020-11-20 14:42

weixin_39540934的博客写这个系列背后的故事咦，面试系列的把基础部分都写完啦，哈哈答，接下来要弄啥嘞~pandas吧外国人开发的翻译成汉语叫熊猫厉害厉害，很接地气一个基于numpy的库干啥的？做数据分析用的而数据分析是python体系下...
Python编程语言入门
2023-08-09 03:55

禅与计算机程序设计艺术的博客 Python 是一种高级、动态的面向对象编程语言，其设计具有很强的可读性，适用于各种应用领域，是当前最流行的编程语言之一。本文首先对Python编程语言进行了介绍，然后详细阐述Python中的一些重要概念及术语，并着重...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月5日

悬赏问题

¥15 关于#hadoop#的问题
¥15 (标签-Python|关键词-socket)
¥15 keil里为什么main.c定义的函数在it.c调用不了
¥50 切换TabTip键盘的输入法
¥15 可否在不同线程中调用封装数据库操作的类
¥15 微带串馈天线阵列每个阵元宽度计算
¥15 keil的map文件中Image component sizes各项意思
¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
¥15 划分vlan后，链路不通了？
¥20 求各位懂行的人，注册表能不能看到usb使用得具体信息，干了什么，传输了什么数据

pandas时间序列索引报错的问题

3条回答 默认 最新

确保正确导入所需的库

读取CSV文件，确保parse_dates参数正确解析时间戳列

将索引转换为时间戳对象

删除'timestamp'列，因为索引已经包含了这个信息

现在可以使用时间戳对象进行索引

例如，获取2012年6月1日的数据

或者使用pd.Timestamp('2012-06-01')进行索引

问题事件

悬赏问题

3条回答默认最新