liuzhen231 2016-04-15 03:16 采纳率: 33.3%
浏览 1839

用java写了一个获取页面内容的方法,报错返回521码

我的代码如下:
strUrl = "http://www.tlnews.cn/dzb/tlrb/html/2016-04/15/node_164.html";
public static String getUrlStr(String strUrl, String charSet){
String urlStr = "";
try {
URL url = new URL(strUrl);
URLConnection uc = url.openConnection();
uc.setRequestProperty("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8");
uc.setRequestProperty("Connection", "Keep-Alive");
uc.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
uc.connect();

        InputStream is = uc.getInputStream();
        InputStreamReader isr = new InputStreamReader(is, charSet);
        BufferedReader br = new BufferedReader(isr);
        StringBuffer strs = new StringBuffer();
        String str;
        while ((str = br.readLine()) != null) {
            strs.append(str + "\r\n");
        }
        urlStr = strs.toString();
        isr.close();
        br.close();
    } catch (Exception e) {
        e.printStackTrace();
    }
    return urlStr;
}
一开始是报403错误,后来加上了uc.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");这句,开始报521错误。我要抓取的链接是http://www.tlnews.cn/dzb/tlrb/html/2016-04/15/node_164.html
错误信息:
java.io.IOException: Server returned HTTP response code: 521 for URL: http://www.tlnews.cn/dzb/tlrb/html/2016-04/14/node_164.html
at sun.net.www.protocol.http.HttpURLConnection.getInputStream(Unknown Source)
at wy.base.test.TestURL.getUrlStr(TestURL.java:32)
at wy.base.test.TestURL.main(TestURL.java:14)
  • 写回答

2条回答

  • lobster12 2016-04-15 08:59
    关注

    远程连接问题?真奇怪、、、、、、

    评论

报告相同问题?

悬赏问题

  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
  • ¥15 数据可视化Python
  • ¥15 要给毕业设计添加扫码登录的功能!!有偿
  • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘