.已知数据集nycfilghts13。
(1)计算出每个目的地的平均延误时间,然后与airports数据框连接,从
而展示出延误的空间分布。以下是画出美国地图的一种简单方法。你可以使用
数据点的size或color属性来表示每个机场的平均延误时间。
airports%>%semi_join(flights,c("faa"="dest"))%>%ggplot(aes(lon,lat))+borders("state")+geom_point()+coord_quickmap()
(2)2013年6月13日发生了什么情况?展示出这天延误时间的空间模式,并上网查询一下这天的天气状况。
(3)找出这一整年中航班延误(dep_delay+arr_delay)最严重的48小
时。与weather数据互相参照,你能找出一些特征吗?
R语言中的数据处理问题
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- CSDN专家-sinJack 2023-04-21 15:40关注
(1) 计算每个目的地的平均延误时间,并与airports数据框连接,展示延误的空间分布:
library(dplyr) library(ggplot2) # 计算每个目的地的平均延误时间 delay_by_dest <- flights %>% group_by(dest) %>% summarize(avg_delay = mean(arr_delay, na.rm = TRUE)) # 与airports数据框连接 delay_by_dest <- airports %>% left_join(delay_by_dest, by = c("faa" = "dest")) # 画出美国地图 ggplot(delay_by_dest, aes(lon, lat)) + borders("state") + geom_point(aes(size = avg_delay), alpha = 0.8) + scale_size_continuous(range = c(1, 10)) + coord_quickmap()
(2) 找出2013年6月13日的延误时间空间模式,并查询该天的天气状况:
# 找出2013年6月13日的延误时间空间模式 delay_by_dest <- flights %>% filter(year == 2013, month == 6, day == 13) %>% group_by(dest) %>% summarize(avg_delay = mean(arr_delay, na.rm = TRUE)) delay_by_dest <- airports %>% left_join(delay_by_dest, by = c("faa" = "dest")) ggplot(delay_by_dest, aes(lon, lat)) + borders("state") + geom_point(aes(size = avg_delay), alpha = 0.8) + scale_size_continuous(range = c(1, 10)) + coord_quickmap()
(3) 找出这一整年中航班延误最严重的48小时,并与weather数据互相参照,找出一些特征:
# 找出这一整年中航班延误最严重的48小时 flights %>% mutate(delay = dep_delay + arr_delay) %>% arrange(desc(delay)) %>% select(year, month, day, hour, delay) %>% head(48)
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 求帮我调试一下freefem代码
- ¥15 R语言Rstudio突然无法启动
- ¥15 关于#matlab#的问题:提取2个图像的变量作为另外一个图像像元的移动量,计算新的位置创建新的图像并提取第二个图像的变量到新的图像
- ¥15 改算法,照着压缩包里边,参考其他代码封装的格式 写到main函数里
- ¥15 用windows做服务的同志有吗
- ¥60 求一个简单的网页(标签-安全|关键词-上传)
- ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法
- ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
- ¥100 为什么这个恒流源电路不能恒流?
- ¥15 有偿求跨组件数据流路径图