hange1991 2023-02-10 13:23 采纳率: 90.9%
浏览 71
已结题

正则findall解析har文件,无法获取目标内容

下载了网页的har文件后,想要进行解析
目标是获取所有以 'https://m.douyin.com/web/api/v2/aweme/post/?reflow_source=reflow_page&sec_uid=%27 开头的url
利用re.findall,为什么获取的是空值,代码哪里写错了,应该改成什么样?

path = 'C:/Users/cuiha/Desktop/小傻子/中国器官移植发展基金会.har'
with open(path, 'r', encoding='UTF-8') as readObj:
    harDirct = json.loads(readObj.read())
# print(harDirct)

str_harDirct = str(harDirct)
pattern = 'https://m.douyin.com/web/api/v2/aweme/post/?reflow_source=reflow_page&sec_uid='

urls = re.findall(pattern, str_harDirct)
print(urls)


  • 写回答

2条回答 默认 最新

  • 盐湖城 2023-02-10 14:25
    关注

    提取的文本发出来一下啊,只有开头,没有结尾怎么写?

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 2月13日
  • 已采纳回答 2月10日
  • 创建了问题 2月10日

悬赏问题

  • ¥15 unity第一人称射击小游戏,有demo,在原脚本的基础上进行修改以达到要求
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥15 cmd cl 0x000007b
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line
  • ¥500 火焰左右视图、视差(基于双目相机)
  • ¥100 set_link_state
  • ¥15 虚幻5 UE美术毛发渲染