qq_27429773 2022-01-19 16:23 采纳率: 100%
浏览 87
已结题

想使用正则表达式匹配,提取文本中特定的内容。

问题遇到的现象和发生背景:

工作需要在文本中,查找指定的内容,输出到其他文本。

问题相关代码,请勿粘贴截图

import os, re

with open (r'C:\Users\tjing\Desktop\python\st.txt','r+') as f:

    Keystart='ONOFFLINE : ON LINE '
    Keyend='Warning:Site-01, ### remote_fetch(cim_TestResult) ### errr!!!'      
    buff = f.read()
    pat = re.compile(Keystart+'(.*?)'+Keyend, re.S)
    result = pat.findall(buff)
    print (result)

附上相关文档

[GPIB]W: (BINON:11111111,11111111,11111111,11111111,11111111,11111111,1111111A,11111A11,11111111,1111111A,1111111A,111A111A,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11A11111,111A1111,A1111111,111111A1,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,1111111A,11111111,11111111,11111A11,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111;

ONOFFLINE : ON LINE
Hello, python!
Warning:Site-01, ### remote_fetch(cim_TestResult) ### errr!!!

[GPIB]W: (BINON:11111111,11111111,11111111,11111111,11111111,11111111,1111111A,11111A11,11111111,1111111A,1111111A,111A111A,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11A11111,111A1111,A1111111,111111A1,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111,1111111A,11111111,11111111,11111A11,11111111,11111111,11111111,11111111,11111111,11111111,11111111,11111111;

运行结果及报错内容

结果一直是空的。

我的解答思路和尝试过的方法

尝试用正则表达式匹配指定内容。

我想要达到的结果

能够读取相应始末位置间的内容。

  • 写回答

2条回答 默认 最新

  • YirongChen 2022-01-19 17:04
    关注

    这应该就是你想要的功能:

    import os, re
    def GetMiddleStr(content,startStr,endStr):
        '''提取字符串content当中,startStr与endStr之间的内容
        
        '''
        startIndex = content.index(startStr)
        if startIndex>=0:
            startIndex += len(startStr)
        endIndex = content.index(endStr)
        return content[startIndex:endIndex]
    
    with open (r'C:\Users\tjing\Desktop\python\st.txt','r+') as f:
        Keystart=r'ONOFFLINE : ON LINE'
        Keyend=r'Warning:Site-01, ### remote_fetch(cim_TestResult) ### errr!!!'      
        buff = f.read()
        result = GetMiddleStr(buff,Keystart,Keyend)
        result = result.strip() # 清除前后的换行符
        print(result)
    

    img

    或者可以将你的源代码改为如下代码:

    import os, re
    
    with open (r'C:\Users\tjing\Desktop\python\st.txt','r+') as f:
        Keystart=r'ONOFFLINE : ON LINE'
        # 将()写为\(\),因为要匹配这个符号本身
        Keyend=r'Warning:Site-01, ### remote_fetch\(cim_TestResult\) ### errr!!!'     
        buff = f.read()
        pat = re.compile(Keystart+r'(.*?)'+Keyend, re.S)
        result = pat.findall(buff)
        print(result)
    

    img

    你的代码没能正确匹配的原因是,Keyend字符串内有英文括号,这在正则表达式里面是特殊符号。
    我建议使用第一种方法,这样,各种特殊符号都不需要特殊处理。
    觉得有帮助请采纳本答案,谢谢哦!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 1月28日
  • 已采纳回答 1月20日
  • 创建了问题 1月19日

悬赏问题

  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同