「已注销」 2016-12-07 07:50 采纳率: 100%
浏览 1322
已采纳

找到一个html页面下所有日期,天气,计数器代码

项目需要做一个页面分析 页面存在 日期,天气,计数器等html代码 我需要找到这些代码并对这些代码进行过滤再进行分析。
如何在java中通过爬虫爬取的页面中找到这些日期,天气,计数器等html代码。请讲解一些思路!谢谢

  • 写回答

3条回答 默认 最新

  • noWayBinding 2016-12-07 08:02
    关注

    简单粗暴地就用jsoup拿正则去匹配那些信息

    高大上的就用一些爬虫框架,可以多线程的抓,国内有个可以试试http://git.oschina.net/l-weiwei/spiderman

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序
  • ¥15 onvif+openssl,vs2022编译openssl64