webKit 实现爬虫 java

做爬虫得时候遇到一个比较难搞定的网站，同事介绍说可以用webkit试下，我的具体需求是
模拟真实浏览器，取出登录之后的页面内容。
不知道webkit能否实现，有没有大神对webkit熟悉的。。。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-05-28 10:50
关注
webkit和ie是两种浏览器的内核。
要模拟访问网站，我们一般不直接用浏览器内核（你又不是开发浏览器）
我们可以用webbrowser（C#、VB）、selenium（python）、JxBrowser（java）等。
因为上面说的就是在你的程序里调用真实的浏览器，除了验证码比较麻烦一点，别的和人操作都没有区别，人能做的，程序肯定能做。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java爬虫模拟登陆失败, 求大神帮忙看看 java 爬虫
2017-09-15 01:13

回答 7 已采纳首次登陆的时候不用set cookie 你登录之后获取的页面跟你输入的url有关你想访问你想访问的页面可以再调用GET方法
关于 java 利用jsoup爬取图片的问题？ java 爬虫
2023-02-13 14:54

回答 3 已采纳每个网站的数据请求方式可能不一样，甚至有些网站不让下载，能够检测到不是人工下载。你可以手动打开那个不能下载的url，复制到浏览器上打开看能否正常显示，其次url是否发生了变化。望采纳！！
爬虫json报错解决方法 python 爬虫
2022-12-09 10:07

回答 1 已采纳 worldDataStr不是标准的json格式，所以用json.loads 会报错
【Java】使用Java实现爬虫
2022-08-04 17:07

Do_GH的博客利用HtmlUtil和HttpClient实现爬取网页内容
java采集页面显示202状态 java 爬虫
2018-09-07 15:58

回答 3 已采纳 http://deal.ggzy.gov.cn/ds/deal/dealList_find.jsp 改为这里找到请求数据的格式，读到JSON，解决链接的问题
前端实现商品倒计时效果，数据来自数据库 html5 javascript 前端
2022-03-10 17:12

回答 1 已采纳你的myfunction方法改了一下，满意请采纳 function myfunction() { var mokuai = ''; for (var i =
使用Jsoup爬虫时，报412错误 java
2021-01-11 11:20

回答 3 已采纳很明显啊，访问这个页面需要什么参数，但你没有携带
day19-爬虫和前端
2022-08-11 19:54

无情秃头怪的博客 day19-爬虫和前端
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
python爬虫怎么改成多线程 python 爬虫
2022-04-29 12:58

回答 6 已采纳楼上的这些线程改造方式放在这里行不通吧。楼主代码中IO操作在循环的地方，这里线程不是应该将循环改成多线程吗。。。##改了一个循环，试一下 ```python import parsel impor
关于爬虫爬取页数的问题 json python 爬虫
2022-09-14 23:27

回答 2 已采纳 import requests import re import json import time fh = open('测试写入.txt', 'a') for i in range(1, 20,
Java-JSOUP(爬虫)
2022-07-17 20:31

胡安民的博客 JSOUP是一款Java的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。官网jsoup实现了WHATWGHTML5规范，并将HTML解析为与...
python爬虫疑问 python 爬虫
2022-09-28 20:27

回答 1 已采纳因为有的url 比如https://wx3.sinaimg.cn/large/005tGGVqgy1h6hjo33dy1j323i72qb2e.jpg 后面多了一个空格，把空格去掉就行了，解决问题的话
java爬虫——爬取网站图片
2019-11-12 17:01

宇运的博客目录问题：java能否实现爬虫，如何爬取jsoup简介获取jsoupMavenGradlejsoup几个常用的类DocumentElement及Elements解决办法：jsoup实现爬虫功能代码展示应用展示总结参考资料问题：java能否实现爬虫，如何爬取在...
python爬虫初步-与java爬虫的比较
2024-04-21 13:42

2401_84009899的博客然而这种爬取网站的方式...我们需要欺骗网站,在java中实现这一点比较常用的是使用HttpClient的jar包来实现。//建立HttpClient类,这是HttpClient的jar包中的一个类。System.out.println(“读取异常”);//读取html的流。
【技术应用】java通过url爬虫获取公众号文章内容
2022-12-01 21:54

Dylan～～～的博客 java通过url爬虫获取公众号文章内容，同时涉及CSDN文章内容爬取，基于开源工具mlunit实现
JAVA爬虫案例——JSOUP爬取图片并使用v-viewer实现图片预览
2021-09-14 14:23

厉害哥哥吖的博客本节我们使用java环境下的jsoup实现网络数据的爬取，主要是图片数据的异步爬取，并实现网络图片的下载及图片的预览功能，预览功能使用具有丰富功能的v-viewer实现。正文引入爬虫pom工具包 <dependency&gt...
JAVA爬虫+jsoup+Kibana+Elasticsearch+vue爬取JD搜索页面
2022-08-18 18:51

程序猿Ada的博客 JAVA爬虫+高亮搜索+jsoup+Kibana+vue界面
没有解决我的问题, 去提问

悬赏问题

¥15 急matlab编程仿真二阶震荡系统
¥20 TEC-9的数据通路实验
¥15 ue5 .3之前好好的现在只要是激活关卡就会崩溃
¥50 MATLAB实现圆柱体容器内球形颗粒堆积
¥15 python如何将动态的多个子列表，拼接后进行集合的交集
¥20 vitis-ai量化基于pytorch框架下的yolov5模型
¥15 如何实现H5在QQ平台上的二次分享卡片效果？
¥15 python爬取bilibili校园招聘网站
¥30 求解达问题（有红包）
¥15 请解包一个pak文件

webKit 实现爬虫 java

4条回答 默认 最新

悬赏问题

4条回答默认最新