用python实现，找出两张表格中指定列中的差异值，并按照表3的格式输出，输出时以SID列前六位码进行分类输出，自动生成六位码命名的文件夹

问题遇到的现象和发生背景：

两张表格以sid列关联后，逐列进行数据比对，发现不一致的数据按照表格3格式输出，并对表格3的sid列前6位码进行分类输出，自动生成六位码命名的文件夹

问题相关代码，请勿粘贴截图

import pandas as pd
df1=pd.read_excel('test.xlsx', sheet_name='内网平台').set_index('sID')
df1.sort_index()
df2=pd.read_excel('test.xlsx', sheet_name='ihaps').set_index('sID')
df_ihaps = df2.groupby(df2.index)[df2.columns[2:4201]].sum()
df_plat=df1.sort_index()
a=df_plat.columns
b=df_ihaps.columns
c=[i for i in b if not i in a]
ihaps=df_ihaps.drop(c,axis=1)
plat=df_plat
for i in ihaps.columns:
df=pd.concat([plat[i],ihaps[i]],axis=1)
df.columns=['old_'+i,'new_'+i]
df['diff']=df[df.columns[0]]-df[df.columns[1]]
df=df[~(df['diff']==0)]
if len(df)==0:continue
df.to_csv(i+'.csv')

运行结果及报错内容

1、输出的表格数据一样，但是相减之后得到一个不为0的值，能否规避这些？（如图）

2、代码执行后，输出许多csv文件，能否在输出的时候以sID列分类输出，以df的sID列的前六位数字自动生成文件夹，把这些csv文件分类放入相应的文件夹呢？

我的解答思路和尝试过的方法

我想要达到的结果

1、把结果输出到不同的文件夹中，文件夹名称和表内sid列前六位码一致。

2、解决数据相同，计算结果却不为0的问题，把计算结果为0的都不输出。

谢谢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ash062 2022-03-19 22:59
关注
说个思路
1、数据相同，相减结果不为零，看结果的数据形式，可考虑添加判断，若diff绝对值小于一小值则不输出

df=df[~(abs(df['diff'])<1e-9)]

2、根据6位数字保存至相应文件夹，只需取出该6位数字，判断当前是否存在该文件夹，不存在则新建一个，相应修改保存路径

import os dirname = i[2:8] # i为循环的文件名 if not os.path.exists(dirname): os.mkdir(dirname) ... df.to_csv('dirname\\' + i + '.csv')
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python 网络爬虫与数据采集（一）
2022-01-30 21:28

秃顶的博客 Python 网络爬虫与数据采集第1章序章网络爬虫基础1 爬虫基本概述1.1 爬虫是什么1.2 爬虫可以做什么1.3 爬虫的分类1.4 爬虫的基本流程1.4.1 浏览网页的流程1.4.2 爬虫的基本流程1.5 爬虫与反爬虫1.5.1 爬虫的攻与防...
兔老大的系统设计（六）报表系统
2024-09-13 04:45

兔老大RabbitMQ的博客写在前面，我认为能看到这个系列后面的，都是交易行业相关的人，所以我不再追求解释每个细节，我会用尽量精炼和准确的语言描述出交易系统的重点、难点和需要特别注意的坑。
Python数据分析
2020-08-02 16:41

Adopat的博客 Python数据分析第一章Python基础 1.1Python解释器 Python是一种解释性语言，Python解释器通过一次执行一条语句来运行程序，在命令行键入python命令可以调用标准交互的Python解释器。键入exit()或者ctrl + z 返回...
熬夜肝出 3w 字测试开发学习路线
2022-03-07 08:45

编程与实战的博客本文将从薪水，职业规划，测试理论基础，自动化测试基础，常用自动化框架，计算机基础及 Python 高频面试题，测试相关高频面试题出发，详细内容如下，希望能对大家有所帮助。薪水我把它放在最前...
AUTOSAR从入门到精通-【应用篇】基于4G网络和CAN总线的车辆在线故障诊断系统设计与实现
2023-07-19 00:15

格图素书的博客目前国内汽车保有数量逐年增加，国内家庭拥有...而在使用汽车时，由于各种外部或者内部原因，汽车难以避免地会发生故障，如果是一般的小故障可能只是造成车辆出现异响、异味或其他异常现象，暂时不影响汽车的使用。
Registry Usage (RU) 学习笔记（15.5）：注册表内存占用体检与 Hive 体量分析
2026-01-03 20:48

杨利杰YJlio的博客主要内容包括： RU 的基本功能：按 hive 或路径统计注册表体积、内存占用、键值数量关键指标解读：Total KB（持久存储大小）、Committed KB（内存占用）、Keys/Values 数量典型使用场景：识别膨胀的注册表 hive，...
快速入门到精通：一篇学会Oracle
2023-08-14 16:06

一碗折耳根的博客 Oracle全面的基础知识和知识点的举例，帮助初学者快速入门。...SQL语句，SQL查询，Oracle函数，代码块知识，条件判断/循环语句，索引、游标，锁，视图，存储过程，触发器，分区表，Oracle优化，建模
面试题笔试-带答案-1
2022-01-18 20:29

勤自省的博客 1.下面中哪两个可以在 A 的子类中使用：（） class A { protected int method1 (int a, int b) { return 0; } } A. public int method 1 (int a, int b) { return 0; } B. private int method1 (int a, int b) { ...
Mysql的基本使用——Mysql教案（一）
2022-05-19 22:20

See you !的博客文章目录Mysql的基本使用1. Mysql的安装2. Mysql基本操作数据库操作表操作SQL操作练习资源课堂练习查询(SELECT)去重(distinct)别名(AS)限制查询数(limit)排序(ORDER BY)条件查询(WHERE)普通查询多条件的查询语句模糊...
【面试宝典】软件测试工程师2021烫手精华版（第三章Mysql基础篇）
2021-03-15 17:10

程序员阿沐的博客外键又称作外关键字在关系数据库中，索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构，它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单表的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月19日