weixin_62936205 2022-12-28 10:01 采纳率: 100%
浏览 13
已结题

数据挖掘r语言分组汇总

rm(list = ls())
library(dplyr)
df <-read.csv("/data/bigfiles/iris.csv")
df <- df %>% as_tibble()
head(df)

新建两列,分别是sepal的长款比(sepal_ratio)和

petal的长宽比(petal_ratio)

df <- df %>%

然后再使用species这一列来分组并汇总

sepal_ratio和petal_ratio的平均值

汇总后的平均值列仍然命名为sepal_ratio和petal_ratio

提示:用group_by和summarize函数

ave <- df %>%

print(round(ave$sepal_ratio, 2))

  • 写回答

2条回答 默认 最新

  • ShowMeAI 2022-12-28 10:27
    关注

    完整填充后的代码如下,望采纳

    # 清空环境中的对象列表
    rm(list = ls())
    
    # 加载 dplyr 包
    library(dplyr)
    
    # 读取 iris 数据集
    df <- read.csv("/data/bigfiles/iris.csv")
    
    # 将数据框转换为 tibble
    df <- df %>% as_tibble()
    
    # 计算花萼和花瓣的长宽比
    df <- df %>%
      # 在数据集中添加两列:花萼长宽比和花瓣长宽比
      mutate(sepal_ratio = Sepal.Length / Sepal.Width,
             petal_ratio = Petal.Length / Petal.Width)
    
    # 按种类分组并计算花萼和花瓣长宽比的平均值
    ave <- df %>%
      group_by(Species) %>%
      summarize(sepal_ratio = mean(sepal_ratio),
                petal_ratio = mean(petal_ratio))
    
    # 输出结果
    print(round(ave$sepal_ratio, 2))
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月5日
  • 已采纳回答 12月28日
  • 创建了问题 12月28日

悬赏问题

  • ¥60 pb数据库修改或者求完整pb库存系统,需为pb自带数据库
  • ¥15 spss统计中二分类变量和有序变量的相关性分析可以用kendall相关分析吗?
  • ¥15 拟通过pc下指令到安卓系统,如果追求响应速度,尽可能无延迟,是不是用安卓模拟器会优于实体的安卓手机?如果是,可以快多少毫秒?
  • ¥20 神经网络Sequential name=sequential, built=False
  • ¥16 Qphython 用xlrd读取excel报错
  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
  • ¥15 相敏解调 matlab
  • ¥15 求lingo代码和思路