roundaboutxa 2022-06-29 18:22 采纳率: 66.7%
浏览 116
已结题

用python提取log中的失败信息的相关参数

有一个文件夹有多个test.log文件
文件内容有多行,提示信息可能不一样,我只需要有下面license failure的这部分:
2021-01-01 07:58:29 Connect from 192.168.1.1 (username/hostname)licensekey1-ABC123456
2021-01-01 07:58:29 Key for 192.168.1.1 (username/hostname)change to licensekey2
2021-01-01 07:58:29 no valid license for floating license key licensekey2, license failure
如何用python在log中抓到“license failure”的关键字,并提取 时间戳,IP地址,username, hostname, license key 1, license key2并写入CSV文件相应的字段里,谢谢🙏

  • 写回答

6条回答 默认 最新

  • xdspower 2022-06-30 08:55
    关注

    你的日志中能保证稳定的结构吗?
    就是在 license failure 的前两行中肯定是类似
    Connect from 192.168.1.1 (username/hostname)licensekey1-ABC123456

    Key for 192.168.1.1 (username/hostname)change to licensekey2

    如果是,则依次移动日志的行指针,先查找 license failure 标志,再在其前面2行中提取你需要的数据即可。
    大致为(此外你的licensekey1licensekey2特征是什么还可能影响下面的正/规则式的具体实现。):

    import os
    import re
     
    path = r"E:/xxx" #读取文件的目录路径
    for root, dirs, files in os.walk(path):
        for fn in files:
            if fn.endswith(".log"): # 依次读取文件
                fh = os.path.join(root,fn)
                print("文件:",fh)
                with open(fh, 'r', encoding='utf-8') as fileObj:
                    r1=“”
                    r2=“”
                    r3=“”
                    for aline  in   fileObj.readline()
                       if r1==“”:
                            r1=aline
                            continue
                       if r2==“”:
                             r2=aline
                            continue
                       r3=aline
                       matchObj = re.search( r"license failure", r3)
                       if matchObj :# 在第3行搜索到特征值,在其上2行中检索信息
                            result1 = re.findall(r'^(\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2})\s*Connect\s+from\s+([ABCDEF\d\.:]+)\s*\((.+)/(.+)\)\s*key\s+([a-z]{4}-[a-z]{4}-[a-z]{4}-[a-z]{4}\s+-\s+[A-Z][A-Z]\d{14})$',r1) #这里提取时间戳、来源IP,username、hostname 、licensekey1
                            result2 =re.findall(r'^\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2}\s+Key\s+for\s+[ABCDEF\d\.:]+\s*\(.+/.+\)\s*change to\s+([a-z]{4}-[a-z]{4}-[a-z]{4}-[a-z]{4}).*$',,r2)     # 这里提取linsekey2   
                            print("T:{}\nIP:{}\nusername:{}\nhostname:{}\nlicensekey1:{}\nlicensekey2:{}".format(result1[0][0],result1[0][1],result1[0][2],result1[0][3],result1[0][4],result2[0][0])) # 根据要求输出提取到的信息,这里没有精确处理,可能还需要调整            
                            r1=""
                            r2=""
                        else:
                            r1=r2
                            r2=r3
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(5条)

报告相同问题?

问题事件

  • 系统已结题 7月12日
  • 已采纳回答 7月4日
  • 修改了问题 6月30日
  • 修改了问题 6月29日
  • 展开全部

悬赏问题

  • ¥15 h3.6m 人类行为预测论文复现
  • ¥50 wordpress项目注册报失败刷新后其实是成功状态,请求排查原因
  • ¥20 linxu服务器僵尸进程不释放,代码如何修改?
  • ¥15 pycharm激活不成功
  • ¥40 如果update 一个列名为参数的value
  • ¥15 基于51单片机的水位检测系统设计中LCD1602一直不显示
  • ¥15 OCS2安装出现问题,请大家给点意见
  • ¥15 ros小车启动launch文件报错
  • ¥15 vs2015到期想登陆但是登陆不上
  • ¥15 IPQ5018制作烧录固件,boot运行失败(操作系统-linux)(相关搜索:操作系统)(相关搜索:操作系统)