该问题来自社区帖: https://bbs.csdn.net/topics/615712025.为符合问答规范, 该问题经过ChatGPT优化
使用 nycflights13 数据集:
- 将该数据集中 flights 和 planes 数据表进行连接,其中最终结果应当包含 flights 中的所有观测值,并且包含 planes 中对应的观测值,并将结果数据框命名为 flights_planes,展示数据框。
- 选取 flights_planes 中 tailnum 中结尾是字母 W 的观测值,将 engine 和 seats 两个变量排列到所有变量最前面(即第一列和第二列),将结果数据框保存为 flights_planes1,展示数据框。
- 分别找出 flights 表中的目的地(dest)和出发地(origin)无法与 airports 表中 faa 相匹配的观测。解释这样的情况会对数据质量产生什么样的问题。