ryuutizen 2011-11-17 20:13
浏览 164
已采纳

關於htmlparser和httpclinet爬蟲問題

我用這兩個做了個簡單的基於google搜索引擎的搜索網頁,可是會出現突然java(也就是爬蟲程序)不能從頁面取得結果的情况,不知道是爲什麽,平時使用的時候都很正常。測試下,就是從網頁解析不到結果。
不知道有沒有人遇到過這個情况。

  • 写回答

6条回答 默认 最新

  • 爱上一条鱼 2011-11-17 20:35
    关注

    可能有些网页编码太差,你的java解析不了
    爬虫应该对这类情况进行处理一下,以免出现一些问题,比如网页里没有外链,或者死循环吧,比如httpclient获取不到html页面也有可能,比如别GFW屏蔽了 会导致exception。。。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?