gjfvip123 2018-05-08 01:30 采纳率: 0%
浏览 1015
已采纳

selenium + phantomjs +python网络抓取问题

在自己做的案例中,我提供了200个网站链接,然后进行网络抓取,每抓取一个网站就保存一个值,但是最后总有一个网站没有存值,我的分析可能是因为这个网站一直处于链接状态,

有没有什么方法可以判断链接网站的时候,如果超过多少秒还处于链接状态则退出并记录?

  • 写回答

2条回答

  • oyljerry 2018-05-08 01:50
    关注
     from selenium import webdriver  
    d= webdriver.PhantomJS()  
    d.set_page_load_timeout(10)  
    d.set_script_timeout(10)
    
    try:  
        d.get(s)  
    except:  
        d.execute_script('window.stop()')  
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥100 求数学坐标画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 自己瞎改改,结果现在又运行不了了
  • ¥15 链式存储应该如何解决
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站