我用這兩個做了個簡單的基於google搜索引擎的搜索網頁,可是會出現突然java(也就是爬蟲程序)不能從頁面取得結果的情况,不知道是爲什麽,平時使用的時候都很正常。測試下,就是從網頁解析不到結果。
不知道有沒有人遇到過這個情况。

關於htmlparser和httpclinet爬蟲問題
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
6条回答 默认 最新
- 爱上一条鱼 2011-11-17 20:35关注
可能有些网页编码太差,你的java解析不了
爬虫应该对这类情况进行处理一下,以免出现一些问题,比如网页里没有外链,或者死循环吧,比如httpclient获取不到html页面也有可能,比如别GFW屏蔽了 会导致exception。。。本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报