clover5200 2017-12-03 10:25 采纳率: 0%
浏览 12022
已结题

R语言数据框分组求最大值

hello,各位大神好,我导入一个CSV文件,有8列,如图。
图片说明

我想按PIN列及vts列作为分组依据,以cls_seq作为统计依据求cls_seq列的较大值。

代码如下

 data1<-read.csv("C:/**/**/Desktop/user_click1.csv")head(data1)  
class(data1)            ##查看data1属性                                                                 
str(data1)                ##查看data1列属性                                                                         
max_seq<- aggregate(data1[7],data1[1:2],max)    ##分组求较大值
head(max_seq)        ##输出max_seq前6行

我觉得答案应该是分组及较大值,如

 pin             vts    cls_seq
*yx_193486389    543    3
*yx_193486389    544    3

但是结果如下图 ,我查过所有数据,cls_seq较大不超过100,可是我的max 列中大部分数据都是好几百,请问是怎么回事,该怎么修改,谢谢各位大神。
图片说明

  • 写回答

3条回答 默认 最新

  • lhhhh521 2017-12-05 07:14
    关注

    举例1:
    cc<-aggregate(iris[,c(1,2,3,4)],by=list(iris[,5]),sum)
    举例2:
    x=data.frame(name=c("张三","李四","王五","赵六"),
    sex=c("M","M","F","F"),age=c(20,40,22,30),height=c(166,170,150,155))
    aggregate(x[,3:4],by=list(sex=x$sex),FUN=mean)

    sex age height

    1 F 26 152.5

    2 M 30 168.0

    评论

报告相同问题?

悬赏问题

  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料