ryuutizen 2011-11-17 20:13
浏览 164
已采纳

關於htmlparser和httpclinet爬蟲問題

我用這兩個做了個簡單的基於google搜索引擎的搜索網頁,可是會出現突然java(也就是爬蟲程序)不能從頁面取得結果的情况,不知道是爲什麽,平時使用的時候都很正常。測試下,就是從網頁解析不到結果。
不知道有沒有人遇到過這個情况。

  • 写回答

6条回答 默认 最新

  • 爱上一条鱼 2011-11-17 20:35
    关注

    可能有些网页编码太差,你的java解析不了
    爬虫应该对这类情况进行处理一下,以免出现一些问题,比如网页里没有外链,或者死循环吧,比如httpclient获取不到html页面也有可能,比如别GFW屏蔽了 会导致exception。。。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?

悬赏问题

  • ¥15 微信小程序协议怎么写
  • ¥15 c语言怎么用printf(“\b \b”)与getch()实现黑框里写入与删除?
  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看