roundaboutxa 2022-06-29 18:22 采纳率: 66.7%
浏览 116
已结题

用python提取log中的失败信息的相关参数

有一个文件夹有多个test.log文件
文件内容有多行,提示信息可能不一样,我只需要有下面license failure的这部分:
2021-01-01 07:58:29 Connect from 192.168.1.1 (username/hostname)licensekey1-ABC123456
2021-01-01 07:58:29 Key for 192.168.1.1 (username/hostname)change to licensekey2
2021-01-01 07:58:29 no valid license for floating license key licensekey2, license failure
如何用python在log中抓到“license failure”的关键字,并提取 时间戳,IP地址,username, hostname, license key 1, license key2并写入CSV文件相应的字段里,谢谢🙏

  • 写回答

6条回答 默认 最新

  • xdspower 2022-06-30 08:55
    关注

    你的日志中能保证稳定的结构吗?
    就是在 license failure 的前两行中肯定是类似
    Connect from 192.168.1.1 (username/hostname)licensekey1-ABC123456

    Key for 192.168.1.1 (username/hostname)change to licensekey2

    如果是,则依次移动日志的行指针,先查找 license failure 标志,再在其前面2行中提取你需要的数据即可。
    大致为(此外你的licensekey1licensekey2特征是什么还可能影响下面的正/规则式的具体实现。):

    import os
    import re
     
    path = r"E:/xxx" #读取文件的目录路径
    for root, dirs, files in os.walk(path):
        for fn in files:
            if fn.endswith(".log"): # 依次读取文件
                fh = os.path.join(root,fn)
                print("文件:",fh)
                with open(fh, 'r', encoding='utf-8') as fileObj:
                    r1=“”
                    r2=“”
                    r3=“”
                    for aline  in   fileObj.readline()
                       if r1==“”:
                            r1=aline
                            continue
                       if r2==“”:
                             r2=aline
                            continue
                       r3=aline
                       matchObj = re.search( r"license failure", r3)
                       if matchObj :# 在第3行搜索到特征值,在其上2行中检索信息
                            result1 = re.findall(r'^(\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2})\s*Connect\s+from\s+([ABCDEF\d\.:]+)\s*\((.+)/(.+)\)\s*key\s+([a-z]{4}-[a-z]{4}-[a-z]{4}-[a-z]{4}\s+-\s+[A-Z][A-Z]\d{14})$',r1) #这里提取时间戳、来源IP,username、hostname 、licensekey1
                            result2 =re.findall(r'^\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2}\s+Key\s+for\s+[ABCDEF\d\.:]+\s*\(.+/.+\)\s*change to\s+([a-z]{4}-[a-z]{4}-[a-z]{4}-[a-z]{4}).*$',,r2)     # 这里提取linsekey2   
                            print("T:{}\nIP:{}\nusername:{}\nhostname:{}\nlicensekey1:{}\nlicensekey2:{}".format(result1[0][0],result1[0][1],result1[0][2],result1[0][3],result1[0][4],result2[0][0])) # 根据要求输出提取到的信息,这里没有精确处理,可能还需要调整            
                            r1=""
                            r2=""
                        else:
                            r1=r2
                            r2=r3
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(5条)

报告相同问题?

问题事件

  • 系统已结题 7月12日
  • 已采纳回答 7月4日
  • 修改了问题 6月30日
  • 修改了问题 6月29日
  • 展开全部

悬赏问题

  • ¥15 TLS1.2协议通信解密
  • ¥40 图书信息管理系统程序编写
  • ¥20 Qcustomplot缩小曲线形状问题
  • ¥15 企业资源规划ERP沙盘模拟
  • ¥15 树莓派控制机械臂传输命令报错,显示摄像头不存在
  • ¥15 前端echarts坐标轴问题
  • ¥15 ad5933的I2C
  • ¥15 请问RTX4060的笔记本电脑可以训练yolov5模型吗?
  • ¥15 数学建模求思路及代码
  • ¥50 silvaco GaN HEMT有栅极场板的击穿电压仿真问题