qq_34423459 2022-03-19 14:04 采纳率: 100%

已结题

用python实现，找出两张表格中指定列中的差异值，并按照表3的格式输出，输出时以SID列前六位码进行分类输出，自动生成六位码命名的文件夹

问题遇到的现象和发生背景：

两张表格以sid列关联后，逐列进行数据比对，发现不一致的数据按照表格3格式输出，并对表格3的sid列前6位码进行分类输出，自动生成六位码命名的文件夹

问题相关代码，请勿粘贴截图

import pandas as pd
df1=pd.read_excel('test.xlsx', sheet_name='内网平台').set_index('sID')
df1.sort_index()
df2=pd.read_excel('test.xlsx', sheet_name='ihaps').set_index('sID')
df_ihaps = df2.groupby(df2.index)[df2.columns[2:4201]].sum()
df_plat=df1.sort_index()
a=df_plat.columns
b=df_ihaps.columns
c=[i for i in b if not i in a]
ihaps=df_ihaps.drop(c,axis=1)
plat=df_plat
for i in ihaps.columns:
df=pd.concat([plat[i],ihaps[i]],axis=1)
df.columns=['old_'+i,'new_'+i]
df['diff']=df[df.columns[0]]-df[df.columns[1]]
df=df[~(df['diff']==0)]
if len(df)==0:continue
df.to_csv(i+'.csv')

运行结果及报错内容

1、输出的表格数据一样，但是相减之后得到一个不为0的值，能否规避这些？（如图）

2、代码执行后，输出许多csv文件，能否在输出的时候以sID列分类输出，以df的sID列的前六位数字自动生成文件夹，把这些csv文件分类放入相应的文件夹呢？

我的解答思路和尝试过的方法

我想要达到的结果

1、把结果输出到不同的文件夹中，文件夹名称和表内sid列前六位码一致。

2、解决数据相同，计算结果却不为0的问题，把计算结果为0的都不输出。

谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ash062 2022-03-19 22:59
关注
说个思路
1、数据相同，相减结果不为零，看结果的数据形式，可考虑添加判断，若diff绝对值小于一小值则不输出

df=df[~(abs(df['diff'])<1e-9)]

2、根据6位数字保存至相应文件夹，只需取出该6位数字，判断当前是否存在该文件夹，不存在则新建一个，相应修改保存路径

import os dirname = i[2:8] # i为循环的文件名 if not os.path.exists(dirname): os.mkdir(dirname) ... df.to_csv('dirname\\' + i + '.csv')
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用python实现，找出两张表格中指定列中的差异值，并按照表3的格式输出 python 有问必答
2022-03-07 23:23

回答 2 已采纳基本的实现方法参考如下代码： import pandas as pd df1=pd.read_csv('t03071.csv').drop(columns='coun').set_index('sid
用python实现，找出两张表格中指定列中的差异值，并按照表3的格式输出，输出时以SID列前六位码进行分类输出，自动生成六位码命名的文件夹 python 开发语言
2022-03-19 14:04

回答 1 已采纳说个思路1、数据相同，相减结果不为零，看结果的数据形式，可考虑添加判断，若diff绝对值小于一小值则不输出 df=df[~(abs(df['diff'])<1e-9)] 2、根据6位数字保存至
利用python将一张总表按指定列进行分类并生成多张表，指定格式 python 有问必答
2021-05-02 09:47

回答 3 已采纳试试这样： import pandas as pd df = pd.read_excel("3605.xlsx")#读取文件 #df['OLT端口'] = df["框号"].map(str) +
Python 网络爬虫与数据采集（一）
2022-01-30 21:28

秃顶的博客 Python 网络爬虫与数据采集第1章序章网络爬虫基础1 爬虫基本概述1.1 爬虫是什么1.2 爬虫可以做什么1.3 爬虫的分类1.4 爬虫的基本流程1.4.1 浏览网页的流程1.4.2 爬虫的基本流程1.5 爬虫与反爬虫1.5.1 爬虫的攻与防...
python如何删除excel某列中不含某些值所在的行 python
2022-03-16 11:18

回答 1 已采纳简单的方法就是，适合数据不多的情况用openpyxl库读入 excel2 到列表从尾部遍历excel1 ，发现包含关键字，用 delete_rows 方法删除
python 修改txt文件中指定几行指定列的内容 python 有问必答
2021-07-17 22:56

回答 1 已采纳没办法直接修改txt文件中指定行指定列的内容。只有读取整个txt文件的内容为二维列表，循环列表修改之后再整个写回文件中给你个例子，解答代码如下：（如有帮助，望采纳！谢谢! 点击我这个回答右上方的【采纳
求Python大佬解题:找出下列英文中所有长度为4个字母的单词并按字典排序列表输出。 list python
2021-05-23 22:39

回答 2 已采纳正则不是很好解决这个问题吗
Python数据分析
2020-08-02 16:41

Adopat的博客 Python数据分析第一章Python基础 1.1Python解释器 Python是一种解释性语言，Python解释器通过一次执行一条语句来运行程序，在命令行键入python命令可以调用标准交互的Python解释器。键入exit()或者ctrl + z 返回...
请问Python中如何用groupby抓取指定列指定值的数据？ python
2019-10-25 19:02

回答 1 已采纳 travel.groupby('Age').filter(lambda x: x['Age'] == 你要的年龄)
python中怎么把输出的一列数字分成两列（excel打开是两列的那种，不是只加个空格） python
2021-09-13 21:32

回答 2 已采纳方法1：因为格式统一，可以使用pandas 的操作，相对简单，如下： import pandas as pd df = pd.read_table('test.txt',delimiter = '
python二维列表怎么寻找某指定列的最大值 python
2023-01-03 09:38

回答 2 已采纳可以使用内置函数 max() 和列表推导式来找到某指定列的最大值及其行索引。示例代码如下： # 定义二维列表 data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] # 定
熬夜肝出 3w 字测试开发学习路线
2022-03-07 08:45

编程与实战的博客本文将从薪水，职业规划，测试理论基础，自动化测试基础，常用自动化框架，计算机基础及 Python 高频面试题，测试相关高频面试题出发，详细内容如下，希望能对大家有所帮助。薪水我把它放在最前...
python处理Excel表格如何计算一列中重复元素对应数值的平均值？ python 有问必答
2021-06-20 01:14

回答 2 已采纳这样写： import pandas as pd df=pd.DataFrame({'类型':['画画','画画','写字','读书','读书'],'总指数':[8,7,6,5,4]}) df
AUTOSAR从入门到精通-【应用篇】基于4G网络和CAN总线的车辆在线故障诊断系统设计与实现
2023-07-19 00:15

格图素书的博客目前国内汽车保有数量逐年增加，国内家庭拥有...而在使用汽车时，由于各种外部或者内部原因，汽车难以避免地会发生故障，如果是一般的小故障可能只是造成车辆出现异响、异味或其他异常现象，暂时不影响汽车的使用。
面试题笔试-带答案-1
2022-01-18 20:29

勤自省的博客 1.下面中哪两个可以在 A 的子类中使用：（） class A { protected int method1 (int a, int b) { return 0; } } A. public int method 1 (int a, int b) { return 0; } B. private int method1 (int a, int b) { ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月19日

悬赏问题

¥15 matlab（相关搜索：紧聚焦）
¥15 基于51单片机的厨房煤气泄露检测报警系统设计
¥15 路易威登官网里边的参数逆向
¥15 Arduino无法同时连接多个hx711模块，如何解决？
¥50 需求一个up主付费课程
¥20 模型在y分布之外的数据上预测能力不好如何解决
¥15 processing提取音乐节奏
¥15 gg加速器加速游戏时，提示不是x86架构
¥15 python按要求编写程序
¥15 Python输入字符串转化为列表排序具体见图，严格按照输入