按excel内的指定内容，从多个csv中读取需要的数据，生成一个新的excel

按excel内的指定内容，从多个csv中读取需要的数据，生成一个新的excel：

一、当前文件夹如下：
包括5个文件：
1.MR_GCST90255375.csv（简称表1）
2.MR_R10_K11_ACUTPANC.csv（简称表2）
meta初步表.xlsx
阳性结果表_初步合并及整理.xlsx
阳性结果表_阳性暴露及研究.xlsx

二、根据“阳性结果表_阳性暴露及研究.xlsx”中的“id.exposure”列的内容，分别从“1.MR_GCST90255375.csv“，“2.MR_R10_K11_ACUTPANC.csv“中提取指定的数据。
阳性结果表_阳性暴露及研究.xlsx内容如下：

1.MR_GCST90255375.csv内容如下（2.MR_R10_K11_ACUTPANC.csv表头相同）：

三、生成的结果表如下：
0、Exposure列的值：为“阳性结果表_阳性暴露及研究.xlsx”表中“id.exposure”列的值；如有重复值，在提取后删除重复值。
1、study列的值：为所提取表（表1或表2）的文件名“”MR_”后的内容
2、Cases列的值：为指定数值（study为GCST90255375的，值为123，study为R10_K11_ACUTPANC，值为456）
3、Noncases列的值：为指定数值（study为GCST90255375的，值为789，study为R10_K11_ACUTPANC，值为1011）
4、“OR“列的值：对应study表（表1或表2）内：id.exposure行与“or”列的交叉单元格值
5、“or_lci95“列的值：对应study表（表1或表2）内：id.exposure行与“or_lci95”列的交叉单元格值
6、“or_uci95“列的值：对应study表（表1或表2）内：id.exposure行与“or_uci95”列的交叉单元格值
7、“P“列的值：对应study表（表1或表2）内：id.exposure行与“pval”列的交叉单元格值
8、以上内容，按生成表的A列（"Exposure"）扩展排序，排序后A列相同的值在一起

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-30 16:15

关注

引自免费微信小程序：皆我百晓生

为了实现这个任务，你需要安装并加载几个R语言的包，例如readxl, tidyverse, 和 janitor。首先，确保这些包已经安装，如果没有，请运行以下命令进行安装：

install.packages(c("readxl", "tidyverse", "janitor"))

接下来，按照以下步骤操作：

读取Excel文件中的元数据信息。
根据元数据找到对应的CSV文件。
读取CSV文件，并根据需要的列进行筛选。
将所有数据整合到一个DataFrame中。
处理重复的曝光ID。
添加固定的案例和非案例计数。
按照 Exposure 排序并输出到新的Excel文件。

下面是完成此任务的完整R代码：

# 加载所需的库
library(readxl)
library(tidyverse)
library(janitor)

# 读取元数据表
meta_data <- read_excel("meta初步表.xlsx")

# 定义函数用于查找并读取CSV文件
find_and_read_csv <- function(file_name) {
  csv_path <- file.path(".", gsub("\\.xlsx$", ".csv", file_name))
  if (file.exists(csv_path)) {
    return(read.csv(csv_path, header = TRUE, stringsAsFactors = FALSE))
  } else {
    stop(paste0("CSV 文件 ", csv_path, " 不存在。"))
  }
}

# 从元数据中获取CSV文件列表
csv_files <- meta_data %>% 
  filter(type == "Microsoft Excel 逗号分隔值文件") %>% 
  pull(name)

# 初始化最终数据框
final_df <- data.frame()

# 对于每个CSV文件，提取所需数据并添加到最终数据框
for (csv_file in csv_files) {
  csv_data <- find_and_read_csv(csv_file)
  
  # 提取特定列
  selected_data <- csv_data %>%
    select(id.exposure, or, or_lci95, or_uci95, pval) %>%
    janitor::clean_names()
  
  # 创建 study 列
  selected_data$study <- sub("MR_", "", csv_file)
  
  # 添加固定案例和非案例计数
  cases <- ifelse(selected_data$study == "GCST90255375", 123, 456)
  non_cases <- ifelse(selected_data$study == "GCST90255375", 789, 1011)
  selected_data$cases <- cases
  selected_data$non_cases <- non_cases
  
  final_df <- bind_rows(final_df, selected_data)
}

# 去除重复的曝光ID
final_df <- unique(final_df)

# 按 Exposure 排序并输出到新Excel文件
write_xlsx(final_df, "result.xlsx", sheet_name = "Results")

这段代码会创建一个名为“result.xlsx”的Excel文件，其中包含按 Exposure 排序的结果表。如果你想要在不同的工作表中保存结果，请将sheet_name参数更改为所需的名称。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(3条)

报告相同问题？

关注问题

VBA批量处理csv或其他excel文件数据
2020-08-25 10:20

4. **整合数据**：如果你想要将多个文件的数据整合到一个新文件中，可以创建一个新的工作簿，然后在每个循环中，将数据复制到这个新工作簿的适当位置。使用`Worksheets.Add`添加新的工作表，然后使用`Range.Copy`和`...
使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法
2020-09-20 08:38

在本文的示例中，有一个名为phase_detector.xlsx的Excel表格文件，使用pd.read_excel()读取，并通过names参数为Excel表格的列指定了新的列名。这之后，你可以根据需要对DataFrame中的数据进行进一步的分析或处理。 ...
数据替换Excel模板变量生成Excel数据
2023-02-07 16:56

通过理解和应用这些知识点，你可以构建一个高效的数据驱动Excel生成系统，大大提升工作效率，尤其是在需要批量生成个性化报告或分析结果的情况下。记得在实际操作中，根据具体需求调整和优化你的解决方案。
unity多语言操作和excel转xml，json，csv
2022-03-20 13:43

本教程将探讨如何在Unity中处理多语言操作，并利用Excel工具转换数据为XML、JSON和CSV格式，以便于管理和导入到项目中。首先，让我们了解Unity中的多语言支持。Unity允许开发者创建一个资源包，包含不同语言版本的...
基于Python的Excel数据处理与词云生成工具_使用Python编程语言结合pandas库高效读取和清洗Excel表格数据通过jieba分词库对文本内容进行智能分词处理利用.zip
2025-12-20 13:26

最后，通过结合各个组件，我们可以设计出一套完整的流程，从读取Excel文件开始，经过数据清洗和分词处理，最终生成词云图，以直观地展现数据中的关键词和热点话题。整个流程不仅自动化程度高，而且具有很强的扩展性...
基于JavaScript的Excel表格数据导出Web应用-实现前端Excel文件读取解析数据导出功能-支持多工作表处理数据转换自定义格式输出-使用SheetJS库处理Excel文.zip
2025-11-17 09:31

本篇文章将深入探讨如何利用JavaScript开发一个能够读取、解析、导出Excel表格数据的Web应用。首先，要实现前端Excel数据的读取，就需要用到专门的库来解析Excel文件。SheetJS（又称xlsx）是一个功能强大的...
方便对比Excel文件【或csv、txt】内容一致性，生成对比报告
2023-06-04 15:36

本项目是基于C#编程语言，利用.NET Framework 4.8进行开发的，旨在提供一个高效、准确的文件内容对比解决方案，并能生成对比报告。首先，我们来看C#语言的选择。C#是Microsoft开发的一种面向对象的编程语言，它与...
Excel-VBA宏编程实例源代码-排序与查询-自动生成财务状况报告.zip
2022-12-14 19:58

本压缩包“Excel-VBA宏编程实例源代码-排序与查询-自动生成财务状况报告.zip”显然提供了这样一个实例，帮助用户了解如何利用VBA来自动化财务报告的生成过程。首先，我们要理解VBA宏的基本概念。宏是VBA代码的集合...
Excel-VBA宏编程实例源代码-排序与查询-快速生成产品报价单.zip
2022-12-14 19:58

本压缩包“Excel-VBA宏编程实例源代码-排序与查询-快速生成产品报价单.zip”正是针对这一主题，提供了一个实际的应用案例，帮助用户学习如何利用VBA进行排序与查询，从而高效地生成产品报价单。首先，我们要理解...
Python读取Excel工作表数据写入CSV、XML、文本
2024-03-15 15:36

Eiceblue的博客本文演示了如何使用Python读取Excel数据并写入到CSV、XML和文本文件中。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月30日

按excel内的指定内容，从多个csv中读取需要的数据，生成一个新的excel

4条回答 默认 最新

问题事件

4条回答默认最新