Rex不辣不辣 2021-07-18 15:16 采纳率: 0%
浏览 496

怎么将月度数据转换成日度数据?

当我准备用LSTM神经网络模型去预测商品的价格的时候,其中考虑到了与商品有关的如销量,价格,人均可支配收入,cpi等维度。问题是这些维度有一些是以天为单位的,有些是以月为单位的,只有统一了单位才可以进行模型训练。我看到有很多类似价格预测的文献里,作者有提到用插值法将月度数据转换为日度数据,但是没有提到具体怎么操作。我在百度上搜,大多数是将日度数据转换成月度数据,很少看见有用的方法。今天这里就想讨论如何将月度数据合理的转换成日度数据。 假如我们有以下月度数据:

img

该如何将他们转成日度数据呢?
方法一:
当月的每一天都按照月度数据填补,如:

img

这样操作起来最简单,但是失去了一些数据的规律性和连贯性。

方法二:
插值法(interpolation),如:

img

这样是不是就看起来合理了许多,但是可能离真实情况可能还是有很大差别,但是比方法一更容易接受和理解。
俗话说,巧妇难为无米之炊。当我们缺少需要的日度数据的时候,用插值法就是一个很好的办法。

下面是具体的例子:

import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt
df=pd.read_excel('cpi 月.xlsx')
y1=df['fruit_cpi']
x1=df['Date']
plt.plot(x1,y1)
df.shape

img

df1=df.set_index('Date').resample('D').interpolate()
date = pd.date_range(start='04/01/2018', periods=len(df1.index))
df1.insert(0,'Date',date,True)
y_afterIp=df1['fruit_cpi']
x_afterIp=df1['Date']

plt.plot(x_afterIp,y_afterIp)
df1.shape

img

数据的行数就从36变到了1066,意味着我们把三年的月度数据转换成了三年的日度数据。而plot出来的图与之前并没有什么大的改变,意味着我们保留了数据的规律性。

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2021-07-19 14:34
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答

    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。

    ​​​​因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 创建了问题 7月18日

悬赏问题

  • ¥15 内网办公电脑进行向日葵
  • ¥15 如何输入双曲线的参数a然后画出双曲线?我输入处理函数加上后就没有用了,不知道怎么回事去掉后双曲线可以画出来
  • ¥50 WPF Lidgren.Network.Core2连接问题
  • ¥15 soildworks装配体的尺寸问题
  • ¥100 有偿寻云闪付SDK转URL技术
  • ¥30 基于信创PC发布的QT应用如何跨用户启动后输入中文
  • ¥20 非root手机,如何精准控制手机流量消耗的大小,如20M
  • ¥15 远程安装一下vasp
  • ¥15 自己做的代码上传图片时,报错
  • ¥15 Lingo线性规划模型怎么搭建