fsyangrui 2014-11-20 05:50 采纳率: 100%
浏览 1552
已采纳

为什么我得到的文本没有内容,全都是逻辑代码,怎么样能获得网页里的文本

public class down {
String text="abc";
String URL="http://zhidao.baidu.com/question/1667030995892031787.html";
HttpClient client=new HttpClient();
GetMethod mythod=new GetMethod(URL);
public void get()
{
try{
int status=client.executeMethod(mythod);
if(status==HttpStatus.SC_OK)
{
text=mythod.getResponseBodyAsString();
System.out.print(text);
}
else{text="cba";}
}catch(Exception e){}

  • 写回答

1条回答

  • microhex 2014-11-20 06:02
    关注

    因为我没找到你的HttpClient和GetMethod两个类,自己写了个方法,希望对你有用:
    `public static void main(String[] args) throws Exception {
    StringBuilder sb = new StringBuilder() ;
    String url="http://zhidao.baidu.com/question/1667030995892031787.html";

        URL uri = new URL(url);
        HttpURLConnection conn = (HttpURLConnection) uri.openConnection();
        conn.setDoInput(true);
        conn.setDoOutput(true);
        BufferedReader reader = new BufferedReader(new InputStreamReader(conn.getInputStream() , "GBK"));
        String line = "" ;
        while((line = reader.readLine()) != null){
            sb.append(line+"\n");
        }
        reader.close();
    
        System.out.println(sb.toString());
    }
        `
    

    当你得到源码时,希望得到该想要的内容是,一般是要截取相应的字符串,,,,,,

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog