zzxjl1111 2019-08-23 02:52 采纳率: 0%
浏览 215

有关beautifulsoup性能问题

 def html_processpage(path):
  h=open(path,'rb')
  soup = BeautifulSoup(h,'lxml',parse_only=SoupStrainer("a"))
  h.close()              
  for a in soup.find_all('a', href=True):         
       if a['href'] and not a['href'].startswith("#"):
          print(a['href']) 
          a['href'] ="javascript:hrefblocked('"+a['href']+"');"
  with open(path, "w",encoding='utf-8') as file:
    file.write(str(soup))

当页面较大(100k左右,含有base64后的图片)时速度非常缓慢,请问各位该如何优化?

运行环境:华为云学生机 2g 1核心 Ubuntu 18.04.2 LTS

链接:https://idealdoc.idealbroker.cn/1.page

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 18:32
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥15 Jenkins+k8s部署slave节点offline
  • ¥15 微信小游戏反编译后,出现找不到分包的情况
  • ¥15 如何实现从tello无人机上获取实时传输的视频流,然后将获取的视频通过yolov5进行检测
  • ¥15 WPF使用Canvas绘制矢量图问题
  • ¥15 用三极管设计一个单管共射放大电路
  • ¥15 孟德尔随机化r语言运行问题
  • ¥15 pyinstaller编译的时候出现No module named 'imp'
  • ¥15 nirs_kit中打码怎么看(打码文件是csv格式)
  • ¥15 怎么把多于硬盘空间放到根目录下
  • ¥15 Matlab问题解答有两个问题