2 li2505601 li2505601 于 2016.03.13 00:56 提问

r语言如何按百分位数对矩阵进行分组 10C

我有各省GDP数据,求的了百分位数,现在需要利用百分位数将所有地区分为3组
并分别利用参数检验和非参数检验方法来分析相邻两组之间gdp有无显著差异,求教高手
pcode name gdp
11 北京 2.133
12 天津 1.5722
13 河北 2.9421
14 山西 1.2759
15 内蒙 1.7769
21 辽宁 2.86
22 吉林 1.3803
23 黑龙 1.5039
31 上海 2.356
32 江苏 6.51
33 浙江 4.0153
34 安徽 2.0848
35 福建_台湾 2.4055
36 江西 1.5708
37 山东 5.9426
41 河南 3.4939
42 湖北 2.7367
43 湖南 2.7048
44 广东_港澳 6.7792
45 广西 1.5672
46 海南 0.35
50 重庆 1.4265
51 四川 2.8536
52 贵州 0.9251
53 云南 1.2815
54 西藏 0.0921
61 陕西 1.7689
62 甘肃 0.6837
63 青海 0.2301
64 宁夏 0.2752
65 新疆 0.9264

2个回答

tanzuozhev
tanzuozhev   2016.04.10 15:16
 dt <- read.delim(text =
'
pcode name gdp
11 北京 2.133
12 天津 1.5722
13 河北 2.9421
14 山西 1.2759
15 内蒙 1.7769
21 辽宁 2.86
22 吉林 1.3803
23 黑龙 1.5039
31 上海 2.356
32 江苏 6.51
33 浙江 4.0153
34 安徽 2.0848
35 福建_台湾 2.4055
36 江西 1.5708
37 山东 5.9426
41 河南 3.4939
42 湖北 2.7367
43 湖南 2.7048
44 广东_港澳 6.7792
45 广西 1.5672
46 海南 0.35
50 重庆 1.4265
51 四川 2.8536
52 贵州 0.9251
53 云南 1.2815
54 西藏 0.0921
61 陕西 1.7689
62 甘肃 0.6837
63 青海 0.2301
64 宁夏 0.2752
65 新疆 0.9264
', sep=' ', header=T)

dt_1 <- dt %>%
  arrange(desc(gdp)) %>%
  mutate(class=c(rep(c(1,2,3), each=10),3))
# 正态性检验
shapiro.test(dt_1$gdp)
# 方差分析
gdp_aov <- aov(gdp~class, dt_1)
summary(gdp_aov)

# Kruskal-Wallis检验
kruskal.test(gdp~class, dt_1)

随后进行多重检验

tanzuozhev
tanzuozhev   2016.04.10 15:18

忘了说了, 一共31组样本不能被3整除, 我按照gdp排列后, 1-10, 11-20, 21-31分为3组

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
R语言学习笔记 —— 数据的分组处理
一、实现数据的分组求和
R语言对矩阵按某一列排序
a <- c(5,4,3,2,1) b <- c(1,2,3,4,5) c c[order(c[,1]),] #按第一列递增排序
R语言之分组数据处理
在我们日常处理数据过程中,经常需要对分类或者分组数据进行相对应的函数处理,以下是个人觉得比较好用的几个函数。#分组变量的处理方法#tapply()函数#by()#aggregate()#plyr包#table()第一步:创建数据,常见数据形式为matrix,data.framesex&amp;lt;-c(&quot;female&quot;,&quot;man&quot;,&quot;female&quot;,&quot;man&quot;,&quot;man&quot;,&quot;man&quot;)d
R 对分组的数据进行排序
朋友要给以月为单位的时间序列数据分组然后按其中一个feature再进行排序。链家的一个面试题也要求对一个地区的数据进行分组然后排序。于是研究了一下怎么弄。数据使用R内建的数据集 ChickWeight&amp;gt; data=ChickWeight&amp;gt; head(data)  weight Time Chick Diet1     42    0     1    12     51    2   ...
R 语言 数据切片,对每个切片组分别操作
R语言中处理frame数据框,根据某一列进行切片分组,之后对每一组进行排序、挑选等操作。 用到的函数主要是splite() lapply() sapply() 其中sapply()可以能够简化输出形式,即如果能把列表简化成矩阵形式那么就转化,如果不能就输出列表。 在下面这个例子中,对于数据框,依据"group"列分为三组,对于每一组,我们依据"value"列进行排序,当出现排序值一样的时候,再
R语言之矩阵排序
首先R语言中矩阵定义以及按列排序
R中如何用ifelse进行数据分组
9.数据分组 数据分组,根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间部分来研究,以揭示内在的联系和规律性; 在R中,我们常用ifelse函数来进行数据的分组,跟excel中的if函数是同一种用法。 ifelse(condition,TRUE,FALSE) > data <- read.table('1.csv', sep='|', header=TRUE);
R语言︱数据分组统计函数族——apply族用法与心得
1、apply函数 对一个数组按行或者按列进行计算,矩阵纵、横运算(sum,average等) > ma <- matrix(c(1:4, 1, 6:8), nrow = 2) > ma [,1] [,2] [,3] [,4] [1,] 1 3 1 7 [2,] 2 4 6 8 > apply(ma, c(1,2), sum)
R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)
R语言︱数据集分组大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较。一、日期分组1、关于时间的包都有很多很好的日期分组应用。2、cut()函数cut(x, n):将连续型变量x分割为有着n个水平的因子cut(x, breaks, labels = NULL, include.lowest = FALS...
r语言分组求和
r语言分组求和求方差工具