我有2份txt文档,a.txt 和 b.txt。每份文档都有511万多行的数据。
我想从a.txt文档里,找出b.txt 所没有的数据
下面的表格是示例
每行开头是一个8位数的数字,叫做ssid,长度都是8位,固定的
只要比较2份文档的ssid就行了。ssid后面的内容不需要做比较
表头 |
---|
15085237,000018718299,沙粒中的宇宙:微电影叙事学研究,尤达著,北京:中国传媒大学出版社,2019.10,252,9787565726125 |
15063264,000019466090,基诺山 太阳的手印,段瑞秋,昆明:云南人民出版社,2021.10,366,9787222204270 |
15006671,000019379527,难产 第2版,刘兴会,漆洪波作,北京:人民卫生出版社,2021.06,728,9787117315098 |
14821405,000018694741,内幕交易的多副面孔,宁荣,北京:经济科学出版社,2019.01,322,9787521807776 |
比如a.txt 有15085237这个ssid,b.txt 没有15085237,那就把15085237这一行,保存到c.txt 里,整行都要保存
另一种方案,比如a.txt 和b.txt 都有15063264,那就把a.txt 里的15063264整行数据都删了,b.txt里的不用删
2种方案不知道哪种更好
我需要一个python代码实现这个功能,能实现其中一个方案就行了
电脑里有python 3.8.10 环境,不过我只学了一些python的基础语法,不知道怎么写