2301_77592235 2024-04-08 16:22 采纳率: 0%
浏览 10
已结题

R软件画图问题关于线图

我的数据库中,记录许多文章的发布时间与更新时间,以及在更新时间内的阅读数量。有许多标题名称不同的文章,每篇文章有自己的发布时间,但相同文章的更新时间不同,阅读数也不一样。我现在需要画一个时间序列图,表示每篇文章随时间增长的阅读数量,应该每条线都是一个上升的趋势然后保持平稳,但画的图片却是交织不清,很多条线成了折线。一会儿上去一会儿下来
以下是我的代码
library(ggplot2)
df7 = data_July2
df7$更新时间
df7$时间 = df7$更新时间-df7$发布时间
df7$时间 = ceiling(df7$时间/60)
df7$公众号 = ifelse(df7$公众号名称 == 'X公司(7月)', "X公司(7月)", "其他公众号")
p6 = ggplot(df7)+
geom_line(aes(时间,阅读数,group = 标题名称,color = 公众号))+
labs(x ='已发布时间(小时)',y = '阅读数',title = '阅读数增长趋势图' ,family = "STKaiti")+
theme(text=element_text(family="STKaiti"))
这是一个多组时间序列图,我设置的时间有问题,如何将其表示成小时呢?按照小时来作为X轴。
难点是:数据记录了很多文章,相同的文章发布时间相同,但更新时间不同。如何将其处理成小时。如:文章A 发布时间 2016-7-31 10:42:44 更新时间 2016-7-31 16:43:20 阅读数758
文章A 发布时间 2016-7-31 10:42:44 更新时间 2016-7-31 18:24:20 阅读数880
这如何处理呢?
是我设置的时间有问题吗?如何设置正确的时间区间?这个图为什么有那么多折线?

img

img

  • 写回答

23条回答 默认 最新

  • 檀越@新空间 2024-04-08 16:22
    关注
    获得0.30元问题酬金

    下午好🌅🌅🌅
    本答案参考ChatGPT-3.5

    针对你的问题,建议采取以下解决方案:

    1. 数据问题:首先需要检查数据的完整性和准确性,例如是否有重复的数据或数据缺失问题,以及是否有异常值需要处理。

    2. 时间序列图问题:在绘制时间序列图时,建议采用坐标轴格式化方式,以确保横坐标时间轴的清晰度。另外,如果数据量较大,建议对数据进行平滑操作或采样操作,在图表中展示数据的趋势变化。

    3. 绘制问题:可以考虑使用ggplot2包中的geom_line函数实现线性图的绘制。需要注意的是,在绘制时需检查数据和代码是否正确,以及颜色的选择是否合适。

    修改后的代码如下:

    library(ggplot2)
    
    df7 <- data_July2
    df7$时间 <- df7$更新时间 - df7$发布时间
    df7$时间 <- ceiling(df7$时间/60)
    df7$公众号 <- ifelse(df7$公众号名称 == 'X公司(7月)', "X公司(7月)", "其他公众号")
    
    p6 <- ggplot(df7) + 
      geom_line(aes(时间, 阅读数, group = 标题名称, color = 公众号)) + 
      labs(x ='已发布时间(小时)', y = '阅读数', title = '阅读数增长趋势图', family = "STKaiti") + 
      theme(text = element_text(family = "STKaiti")) + 
      scale_x_continuous(breaks = seq(0, 100, by = 10))
    p6
    

    希望以上解决方案能够帮助你解决问题。

    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 4月16日
  • 修改了问题 4月8日
  • 修改了问题 4月8日
  • 赞助了问题酬金15元 4月8日
  • 展开全部