子集数据帧中的拖放因子级别

I have a data frame containing a factor. When I create a subset of this data frame using subset() or another indexing function, a new data frame is created. However, the factor variable retains all of its original levels -- even when they do not exist in the new data frame.

This creates headaches when doing faceted plotting or using functions that rely on factor levels.

What is the most succinct way to remove levels from a factor in my new data frame?

Here's my example:

df <- data.frame(letters=letters[1:5],
                    numbers=seq(1:5))

levels(df$letters)
## [1] "a" "b" "c" "d" "e"

subdf <- subset(df, numbers <= 3)
##   letters numbers
## 1       a       1
## 2       b       2
## 3       c       3    

## but the levels are still there!
levels(subdf$letters)
## [1] "a" "b" "c" "d" "e"

转载于:https://stackoverflow.com/questions/1195826/drop-factor-levels-in-a-subsetted-data-frame

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

12条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
狐狸.fox 2009-07-28 22:41
关注
All you should have to do is to apply factor() to your variable again after subsetting:

> subdf$letters [1] a b c Levels: a b c d e subdf$letters <- factor(subdf$letters) > subdf$letters [1] a b c Levels: a b c

EDIT

From the factor page example:

factor(ff) # drops the levels that do not occur

For dropping levels from all factor columns in a dataframe, you can use:

subdf <- subset(df, numbers <= 3) subdf[] <- lapply(subdf, function(x) if(is.factor(x)) factor(x) else x)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(11条)

报告相同问题？

关注问题

r语言ggplot合并图形_R中带有ggplot2的图形
2020-09-09 06:21

weixin_26737625的博客 r语言ggplot合并图形介绍 (Introduction) R is known to be a really powerful programming language when it comes to graphics and visualizations (in addition to statistics and data science of course!). 当...
CoppeliaSim用户手册中文翻译版（一）
2020-07-05 18:25

汤姆与贝塔的博客 6种编程语言（C/C++、Python、Java、Lua、Matlab和Octave）超过400种不同的应用编程接口函数 4种物理引擎（ODE、Bullet、Vortex、Newton）集成射线追踪仪（POV-Ray）完整的运动学解算器（对于任何机构的逆运动学...
CoppeliaSim用户手册中文翻译版（二）
2020-10-12 10:56

汤姆与贝塔的博客 6.6 通讯方式 6.7 以编程方式访问对象 6.8 CoppeliaSim API框架 6.8.1 常规API 6.8.1.1 常规API函数列表（按字母顺序） 6.8.1.2 常规API（按类别） 6.8.1.3 API常量 6.8.1.4 对象参数ID 6.8.1.5 显式和非显式调用 ...
CoppeliaSim(V-rep)手册中文翻译
2020-07-20 19:01

Norach的博客如果拖放区域不受支持或不合适，则捕获的缩略图将显示为黑色。 [模型浏览器] 场景层次结构：默认情况下，场景层次结构是可见的，但可以使用其相应的工具栏按钮进行切换。它显示场景的内容（即组成场景的所有场景对象...
【信息科学与工程学】【研发体系】第十篇半导体电路设计——124 光计算系统（集成光子与光电协同）第三部分纯光交换与光互连系统 02 数据中心光交换
2025-06-29 15:45

flyair_China的博客数据中心光交换
python中文语料分词处理，按字或者词cut_sentence
2020-02-19 22:43

高颜值的杀生丸的博客文档级别 sgjsj 取随机数 sgjsj 音频合成 sgjsj 普通语言学 sgjsj 添加行 sgjsj 释放资源 sgjsj 网络分割 sgjsj 计算系统 sgjsj 磁膜 sgjsj 色键 sgjsj 程序集变量 sgjsj 远程调用 sgjsj 顺序加电 sgjsj 控制技术 ...
【审计专栏】【信息科学与工程学】【法律领域】第二篇企业内/企业间/B2B &B2C&B2G领域中的合法伤害权03 云计算平台合法伤害权模型全集 1.1 计算服务锁定（2）套利交易/选择性欺诈行为
2025-06-27 07:51

flyair_China的博客自动向量化依赖：编译器自动向量化策略（如循环展开因子、数据对齐假设）针对目标硬件的向量宽度和特性。更换硬件，自动向量化可能生成次优代码。 4. 运行时检测与分发：可通过CPU特性检测在运行时选择不同代码路径...
iOS_SpriteKit_02_SpriteKit编程指南
2016-12-06 17:33

WenyHoooo的博客关于Sprite Kit SpriteKit提供了一个图形渲染（rendering）和动画的...你的游戏确定场景的内容，以及这些内容如何在每帧中变化。Sprite Kit做的工作，就是有效地利用图形硬件来渲染动画的帧。Sprite Kit优化到
SolidWorks认证考试题详解与实战
2025-07-26 14:44

DIY飞跃计划的博客考试题型包括多选题、填空题和实际操作题，内容涉及用户界面、草图绘制、特征建模、装配体设计、工程图、表面建模、有限元分析、模具工具、动画与渲染以及数据管理等方面，为工程师提供全面的专业能力验证。...
51c自动驾驶~合集8
2024-08-01 03:54

大蛇瞪眼-风若璃的博客定义如下：给定个功能模块，其中所有模块或其中的一个子集是相关的，而多模块学习的目的是通过使用所有模型集成中包含的知识来共同学习个模块，以提高模型对共同任务的学习能力。论文中提出了面向功能模块集成和跨...
没有解决我的问题, 去提问

子集数据帧中的拖放因子级别

12条回答 默认 最新

12条回答默认最新