python 爬虫问题：如何按照指定顺序爬取想要获取的信息，使用那种规则可以做到？

程序目的是：爬取文本
需要爬取的网页源代码的结构是这样的：

目的是：跳过第一个标签（不知道怎么跳过），读取接下来的所有标签内容（按照顺序）。
本人原先代码：

使用xpath，爬取p标签的内容，那么它会爬取所有的P标签，和跳过所有的h2和strong标签，就算我写上定位到h2和strong标签的xpath规则，它也只会一次性返回h2或者strong的列表，而我需要它按照网页顺序进行爬取，请问怎么样做到
最后整理：1.如何跳过第一个p标签
2.如何按照顺序把div里的文本内容爬取出来

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-天际的海浪 2021-09-14 19:20
关注
你爬取所有的P标签之后再把第一删除不就好了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 爬虫问题：如何按照指定顺序爬取想要获取的信息，使用那种规则可以做到？ python 有问必答
2021-09-14 19:14

回答 1 已采纳你爬取所有的P标签之后再把第一删除不就好了
关于#python#的问题：python爬虫爬取百度图片 python 有问必答爬虫
2021-11-27 22:00

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
关于#python#的问题：爬虫怎么爬取vue的数据，找不到url连接，懂爬虫给我分析一下 python 爬虫
2023-02-19 14:54

回答 1 已采纳 Vue.js 是一个前端框架，常用于构建单页应用程序（SPA）和动态网页。因此，Vue.js 的数据通常是由前端通过异步请求获取并展示的，而不是像传统的多页应用程序一样，由服务器直接渲染并返回 HTM
python爬虫训练：爬取榜单信息
2022-05-22 11:27

幻影九千七的博客这学期的大作业是要根据这学期的学习内容做一个综合程序，这次是一个爬取酷狗音乐飙升榜单的信息，并下载下来。可以方便和我一样喜欢白嫖的人员免费下载音乐。二、使用的库主要使用了requests库、BeautifulSoup...
python3 爬虫问题：如何爬取文本从图片里面，破解这种图片反爬虫手段！ python 有问必答爬虫
2021-08-24 15:09

回答 5 已采纳只能使用OCR识别了，没有什么好的办法，就是一张图片。你可以试试CSDN的图片识别，接口网址：https://bizapi.csdn.net/mp/ask/v1/ai/ocrText 提问题时检查图片
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
如何用python爬取数据_简述python爬虫原理：如何用爬虫爬取数据
2020-11-23 22:35

weixin_39542850的博客如果我们把互联网比作一张大的蜘蛛网，数据便是存放于蜘蛛网的各个节点，而爬虫就是一只小蜘蛛，沿着网络抓取自己的猎物(数据)爬虫指的是：向网站发起请求，获取资源后分析并提取有用数据的程序，存放起来使用。...
python爬虫爬取jsonp请求的响应数据怎么获取 json python
2021-05-22 21:34

回答 1 已采纳这里我们以爬取淘宝评论为例子讲解一下如何去做到的。这里主要分为了四步：一获取淘宝评论时，ajax请求链接（url）二获取该ajax请求返回的json数据三使用python解析js
关于#python#的问题：爬虫开发者为别人提供了一份爬虫工具，使用者违规爬取三方机密数据 python 爬虫
2023-01-30 18:19

回答 1 已采纳使用者肯定进去，这不用说，至于开发者，就存在具体情况，假如以买卖的方式提供，也跑不了。望采纳
通过python爬虫，爬取到的图片无法打开，请问要怎么办？ pycharm python
2021-08-11 23:59

回答 2 已采纳你是真的秀，没有请求图片地址获得数据肯定打不开啊，你写入的是列表的的文本的二进制，并不是图片的。应该在图片链接后面再请求一次图片网址，然后写入获得的响应数据的二进制内容，望采纳哈
python爬虫实战——小说爬取
2023-05-21 21:01

清清清清弦的博客基于requests库和lxml库编写的爬虫，目标小说网站域名http://www.365kk.cc/，类似的小说网站殊途同归，均可采用本文方法爬取。
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
Python 网络爬虫：初使用selenium爬取百度图片
2021-01-25 15:42

一壶清玖的博客初使用selenium爬取百度图片文章目录初使用selenium爬取百度图片前言一、selenium是什么？二、使用步骤1.selenium的安装配置2.读入数据总结前言这周发生了很多悲伤的事情，一时间五味杂陈。不管让自己停下，...
python爬虫，python学习，如何用python爬取视频资源
2021-09-19 18:42

僭醴。的博客郑重声明：该文章仅供参考学习，他人不得转载，利用非法手段牟利。...第二步，编写python代码四.AES加密的的m3u8文件 first.我们需要下载每一集的目录（m3u8文件） second.上代码这篇文章的由来，是我为.
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月14日

悬赏问题

¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 下图接收小电路，谁知道原理
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

python 爬虫问题：如何按照指定顺序爬取想要获取的信息，使用那种规则可以做到？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新