qizi456258 2012-06-27 21:13
浏览 262
已采纳

java网页抓取其中2个字符串

  • 写回答

1条回答 默认 最新

  • wayne_ren 2012-06-28 10:34
    关注

    有空研究研究XPath,你能很轻松的取到页面上所有的信息。

    [code="java"]private static void getTrackInfo(String html) throws Exception {

    DOMParser parser = new DOMParser();
    parser.parse(html);
    Node node = parser.getDocument();
    
    NodeList dllist = XPathAPI.selectNodeList(node, "//DL");
    System.out.println(dllist.getLength());
    
    //运送信息
    //--运送日期
    System.out.println(deleteSpace(dllist.item(2).getTextContent()));       
    //--寄存地址
    System.out.println(deleteSpace(dllist.item(3).getTextContent()));       
    //--签收人
    System.out.println(deleteSpace(dllist.item(4).getTextContent()));
    
    //其他信息      
    //--发货或收款日期/类型/重量
    System.out.println(deleteSpace(dllist.item(5).getTextContent()));       
    //--收件人
    System.out.println(deleteSpace(dllist.item(6).getTextContent()));
    

    }[/code]

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog