背景:处理50etf和对应的认沽认购数据时,想将这三者的时间-价格走势在同一张图中体现。数据源是每日的分笔数据。整合后如下:
可以看到有很多时刻下对应的价格没有数据,并且有很多时间是重叠的。在这里我进行了两步处理:
1.对价格部分fillna
2.简单去重(保留重复时刻中首个的数据)
在得到这样一个dataframe之后,我利用matplotlib官方文档中提供的‘skip date where there is no date'方法对数据的x轴时间进行处理。
结果:
可以看到,三条线都有不同程度的断点,不连续,50ETF这条线问题尤其明显。
综合上述,我的疑问如下:
1 我的数据处理方式是正确的吗?(特别是fillna 和 duplicated部分的处理)
2 生成图像的断点/不连续原因是什么?如何解决?(求大佬赐代码)【已解决,实际是连续的,设置下线宽就看出来了。其他两个问题继续求解~】
3 如何对成交量的部分作一个区分?如内盘对应的成交量柱形显示为绿色,外盘对应的成交量柱形显示为红色。
第一次提问,不知道在哪里上传数据的源文件,请见谅。
谢谢各位大佬!