java爬虫页面class都一样怎么办

爬取某招聘网站数据，工作经验和项目经验class一致，工作经验内各个时间段的工作经验class还是一致，如何拆分

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱打架的小白兔 2018-09-29 05:49
关注
最好能上个样例.自己寻找规律自定义吧.一般现在的网站为了防止非法抓取数据都是做一些防护的.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java爬虫页面class都一样怎么办 java 爬虫
2018-09-29 03:13

回答 1 已采纳最好能上个样例.自己寻找规律自定义吧.一般现在的网站为了防止非法抓取数据都是做一些防护的.
python后端开发或爬虫怎么系统学习？ python 后端爬虫
2023-04-13 13:18

回答 1 已采纳爬虫严格来讲并不算一个大方向，更偏向于js逆向，python的话推荐走后端方向至于系统学习的话，推荐去blibili找一些路线，然后根据路线去找bilibili上播放量比较高的视频进行系统学习
Java爬虫遇到403怎么办
2016-07-13 02:56

回答 3 已采纳 403错误是网站访问过程中，常见的错误提示。资源不可用。服务器理解客户的请求，但拒绝处理它。通常由于服务器上文件或目录的权限设置导致；同一IP服务器做了限制的，建议你换IP
spring boot+java +jsoup+ 爬虫
2022-03-30 22:11

Java 作为后端编程语言，因其性能稳定、跨平台性以及丰富的库支持而被广泛应用于爬虫开发。Java的HttpURLConnection或者Apache HttpClient库可用于发送HTTP请求，获取网页内容。在此项目中，Java是实现爬虫逻辑的...
java爬虫获取小说相关内容 java 爬虫
2017-06-30 01:53

回答 2 已采纳请参考我发的一个帖子[完整的小说站点爬虫-spring-mybatis-jsoup-http-client ](http://www.52pojie.cn/thread-542306-1-1.html
抓包数据和爬虫数据不一样 python 爬虫
2022-09-16 18:03

回答 1 已采纳补全headers和cookies相关参数再去请求就好了
java 爬虫爬取网页,,,, java 爬虫
2017-09-26 09:29

回答 4 已采纳除了非正常方式登录，无解
JAVA爬虫入门篇——jsoup
2024-05-04 11:41

Olrookie的博客在一个偶然的机会下，我接到了一个网页爬虫的需求。但是之前对爬虫也只是偶尔听说，那么这次就借这次机会来进行一次爬虫相关入门。然而由于本人技术栈限制，这次仅是通过Java进行爬虫进行入门学习。
python3爬虫页面404 python 爬虫
2023-03-19 21:38

回答 4 已采纳用下面的方式可以请求到数据 from requests import Session url = "https://www.luogu.com.cn/" headers = { 'acce
急！请问java的jsoup爬虫如何完整获得响应验证码？ java 开发语言爬虫
2022-04-21 11:40

回答 2 已采纳代码抛了异常，后面的代码没有执行。try catch 下抛出异常的代码试下。
selenium爬虫遇到VIP页面以及爬取次数限制时该怎么办 python selenium 爬虫
2021-10-24 12:56

回答 1 已采纳遇到VIP页面，我想你应该需要一个VIP会员，并以登入破解。限制爬取次数上，可以用proxy轮转或尽量拉长sleep时间或多办几个账号以上浅见
高效的Java爬虫实战：网页数据抓取技巧分享
2024-06-26 15:31

ShopScraperPro的博客本文介绍了Java爬虫的基本原理，并通过具体代码示例展示了如何使用Java编写高效的网页爬虫。在实际应用中，还需要注意合法使用爬虫，尊重网站的隐私政策和服务条款，以免引起法律纠纷。为了解决这个问题，人们开发了...
使用jsoup爬虫时，页面标签有变化如何处理 java 爬虫
2022-01-05 11:52

回答 1 已采纳那看外面还有大标签嘛.爬虫的话.一般标签发生变化也就是网页改版.是需要重新修改代码的.没有一劳永逸的.就是爬虫代码是需要维护更新的
Java多线程及分布式爬虫架构原理解析
2020-08-25 13:11

分布式爬虫通常包含多个爬虫节点，每个节点都可以是一个独立的多线程爬虫。节点之间通过消息队列进行通信，共享待爬取的URL，实现负载均衡。例如，可以使用RabbitMQ或Kafka作为消息中间件，协调各个节点的工作。 ...
Java-网络爬虫(一)
2024-01-02 17:43

多加点辣也没关系的博客在大数据时代，信息采集是一项重要的工作，而互联网中的数据是海量的，如果单纯靠人力进行信息获取，不仅低效繁琐，而且搜集的成本也会提高，如何自动高效地获取互联网中的数据是一个重要的问题，而爬虫技术就是针对...
没有解决我的问题, 去提问

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

java爬虫 页面class都一样怎么办

1条回答 默认 最新

悬赏问题

java爬虫页面class都一样怎么办

1条回答默认最新