想解决的问题如下:现有大量数据,以日为单位。每日的数据又每隔半小时统计一次,因此每天会产生48个数据。现在想通过对这些数据进行处理,将每天的平均值求出来。即以48个数据为一组,求出每组的平均值。
首先我用了excel中的offset函数,公式为“=AVERAGE(OFFSET($B$2,(ROW( )-ROW($B$2))*48,,48))”,得出了结果。但后来验证发现,有许多结果与自己单独用average函数拉出来的结果不一致。但又找不出任何问题。
接下来又尝试用python进行处理,代码如下:
import pandas as pd
df=pd.read_excel('C:/Data/data1.xlsx')
data_0=[ ]
i=0
while i<=len(df):
data0=df['data'][i:i+48]
data1=sum(data0)/len(data0)
data_0.append(data1)
i=i+48
df[' daily average']=data_0
发现用python得出的结果与先前直接用offset函数得出的结果一致,而且与正确结果也有大量数据的偏差。因此想问问大家这是为什么,有什么方法可以解决?