Antonio_Hu_123 2021-06-16 15:14 采纳率: 0%
浏览 40

如何用python匹配数据内容

条件如下:手头有两个文件:


其中一个excel文件有id和id信息,每个都是独立的;

另一个是一个txt格式文件,每两行为一个单独的数据,分别是位于第一行数据名和第二行序列名,其中excel文件中的id信息会包含在序列名中。

我需要利用excel文件中的id信息去匹配txt文件中的包含id信息的序列名,之后把匹配到的数据名提取并打印。

 

能想到的办法是用re包。

代码如下:

import re
target = open(”txt文件所在的地址“, "r")
finder = open("excel文件所在的地址", "r")
result=re.compile(finder).findall(target)
print(result)

 

给我的报错是

 first argument must be string or compiled pattern

我不知道这样做是否正确,或者还有别的好方法。

请各位大神出出主意,本人工作一般不用python,实在不知道还有没有别的包或者方法可以解决问题。

(由于数据量比较大且两个文件格式不相同,所以没有办法将txt文件转换成excel文件)

  • 写回答

2条回答 默认 最新

  • CSDN专家-文盲老顾 2021-06-16 15:20
    关注

    python正则的定义和其他不太一样

    re.complie('正则表达式').findall('原始字符串')

    你的finder是一个文件信息,不能作为正则表达式使用

    根据你的描述,你应该用excel或excel数据库方式打开你的excel文件,然后读取其中的id信息,然后根据id信息组成正则表达式来匹配文本文件中的内容

    先参考下这个文章https://blog.csdn.net/liyuanjinglyj/article/details/87895700

    评论

报告相同问题?

悬赏问题

  • ¥15 有赏,i卡绘世画不出
  • ¥15 如何用stata画出文献中常见的安慰剂检验图
  • ¥15 c语言链表结构体数据插入
  • ¥40 使用MATLAB解答线性代数问题
  • ¥15 COCOS的问题COCOS的问题
  • ¥15 FPGA-SRIO初始化失败
  • ¥15 MapReduce实现倒排索引失败
  • ¥15 ZABBIX6.0L连接数据库报错,如何解决?(操作系统-centos)
  • ¥15 找一位技术过硬的游戏pj程序员
  • ¥15 matlab生成电测深三层曲线模型代码