我的数据库中,记录许多文章的发布时间与更新时间,以及在更新时间内的阅读数量。有许多标题名称不同的文章,每篇文章有自己的发布时间,但相同文章的更新时间不同,阅读数也不一样。我现在需要画一个时间序列图,表示每篇文章随时间增长的阅读数量,应该每条线都是一个上升的趋势然后保持平稳,但画的图片却是交织不清,很多条线成了折线。一会儿上去一会儿下来
以下是我的代码
library(ggplot2)
df7 = data_July2
df7$更新时间
df7$时间 = df7$更新时间-df7$发布时间
df7$时间 = ceiling(df7$时间/60)
df7$公众号 = ifelse(df7$公众号名称 == 'X公司(7月)', "X公司(7月)", "其他公众号")
p6 = ggplot(df7)+
geom_line(aes(时间,阅读数,group = 标题名称,color = 公众号))+
labs(x ='已发布时间(小时)',y = '阅读数',title = '阅读数增长趋势图' ,family = "STKaiti")+
theme(text=element_text(family="STKaiti"))
这是一个多组时间序列图,我设置的时间有问题,如何将其表示成小时呢?按照小时来作为X轴。
难点是:数据记录了很多文章,相同的文章发布时间相同,但更新时间不同。如何将其处理成小时。如:文章A 发布时间 2016-7-31 10:42:44 更新时间 2016-7-31 16:43:20 阅读数758
文章A 发布时间 2016-7-31 10:42:44 更新时间 2016-7-31 18:24:20 阅读数880
这如何处理呢?
是我设置的时间有问题吗?如何设置正确的时间区间?这个图为什么有那么多折线?

