最近项目需要用到爬虫,使用的Jsoup,但是对应的数据是根据查询得到的,JAVA中如何触发获取呢。
4条回答 默认 最新
- 德芙此刻尽丝滑 2020-01-20 16:23关注
JAVA爬虫模拟执行页面点击事件,需引入依赖
<dependency> <groupId>net.sourceforge.htmlunit</groupId> <artifactId>com.springsource.com.gargoylesoftware.htmlunit</artifactId> <version>2.6.0</version> </dependency>
// 获取指定网页实体 HtmlPage page = getHtmlPage("https://www.baidu.com/"); System.out.println(page.asText()); //asText()是以文本格式显示 System.out.println(page.asXml()); //asXml()是以xml格式显示 // 获取搜索输入框 HtmlInput input = page.getHtmlElementById("kw"); // 往输入框 “填值” input.setValueAttribute("绿林寻猫"); // 获取搜索按钮 HtmlInput btn = page.getHtmlElementById("su"); // “点击” 搜索 HtmlPage page2 = btn.click(); // 选择元素 List<HtmlElement> spanList=(List<HtmlElement>)page2.getByXPath("//h3[@class='t']/a"); for(int i=0;i<spanList.size();i++) { // 输出新页面的文本 System.out.println(i+1+"、"+spanList.get(i).asText()); }
解决 2无用
悬赏问题
- ¥15 delta降尺度计算的一些细节,有偿
- ¥15 Arduino红外遥控代码有问题
- ¥15 数值计算离散正交多项式
- ¥30 数值计算均差系数编程
- ¥15 redis-full-check比较 两个集群的数据出错
- ¥15 Matlab编程问题
- ¥15 训练的多模态特征融合模型准确度很低怎么办
- ¥15 kylin启动报错log4j类冲突
- ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
- ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序