qizi456258 2012-06-27 21:13
浏览 262
已采纳

java网页抓取其中2个字符串

  • 写回答

1条回答 默认 最新

  • wayne_ren 2012-06-28 10:34
    关注

    有空研究研究XPath,你能很轻松的取到页面上所有的信息。

    [code="java"]private static void getTrackInfo(String html) throws Exception {

    DOMParser parser = new DOMParser();
    parser.parse(html);
    Node node = parser.getDocument();
    
    NodeList dllist = XPathAPI.selectNodeList(node, "//DL");
    System.out.println(dllist.getLength());
    
    //运送信息
    //--运送日期
    System.out.println(deleteSpace(dllist.item(2).getTextContent()));       
    //--寄存地址
    System.out.println(deleteSpace(dllist.item(3).getTextContent()));       
    //--签收人
    System.out.println(deleteSpace(dllist.item(4).getTextContent()));
    
    //其他信息      
    //--发货或收款日期/类型/重量
    System.out.println(deleteSpace(dllist.item(5).getTextContent()));       
    //--收件人
    System.out.println(deleteSpace(dllist.item(6).getTextContent()));
    

    }[/code]

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 运筹学中在线排序的时间在线排序的在线LPT算法
  • ¥30 求一段fortran代码用IVF编译运行的结果
  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 lammps拉伸应力应变曲线分析
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
  • ¥30 python代码,帮调试,帮帮忙吧