xpath爬虫小说正文爬不到

我是用requests-html来爬取的，到xpath小说内容的时候始终爬不到正文，是这个页面 ��_ ��1�� Ѳ��˾-��Ȥ�� ӥ��С��С˵�� 1�� Ѳ��˾��Ķ�� https://www.zhhbiqu.com/26391_26391428/661759774.html%EF%BC%8C%E6%88%91%E6%98%AF%E4%B8%AA%E5%B0%8F%E7%99%BD%EF%BC%8C%E4%B9%9F%E4%B8%8D%E6%87%82%E7%BD%91%E9%A1%B5%E5%8E%9F%E7%90%86%EF%BC%8C%E5%8F%AA%E6%98%AF%E5%9C%A8csda%E4%B8%8A%E7%9C%8B%E6%BA%90%E7%A0%81%EF%BC%8C%E4%B8%9C%E6%8B%BC%E8%A5%BF%E5%87%91%E7%9A%84%EF%BC%8C%E6%9C%89%E7%9A%84%E9%A1%B5%E9%9D%A2%E8%83%BD%E7%88%AC%E4%B8%8B%E6%9D%A5%EF%BC%8C%E4%B8%8A%E9%9D%A2%E8%BF%99%E4%B8%AA%E9%A1%B5%E9%9D%A2%E6%AD%A3%E6%96%87%E5%9C%A8div class=read2下面，但是下面还有一个标签和正文是并列的，用text()只能爬到并列标签下的内容，爬不到正文，不知道是怎么回事，是这个库的用法不一样吗？还是什么问题？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
忍气吞声埋头苦干 2021-08-16 11:46
关注
看了下这个用上级标签 id =content 来匹配
然后用string(.) 方法提取标签下所有内容。再对脏数据做下剔除清洗。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬虫之xpath入门
2024-03-19 23:24

hjc_042043的博客 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常类似。使用chrome 插件选择标签时候，选中时，选中的标签会添加属性class=“xh-highlight”
Python爬虫实战之xpath解析
2022-08-01 19:59

阿浩(￣▽￣)的博客 XPath是一门在XML文档中查找信息的语言，最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。所以在Python爬虫中，我们经常使用xpath解析这种高效便捷的方式来提取信息。
手把手教你使用python爬虫之xpath
2023-12-29 12:13

景天科技苑的博客 xpath表达式如何理解？html中的标签是遵从树状结构的。切记:xpath表达式中最好不要出现tbody标签，因为tbody标签可能是浏览器加的，可以通过查看网页源代码判断是否是真实的tbody！tbody可能是源代码自带的，也有...
python爬虫：使用xpath基础+实例
2023-07-31 13:31

SeverinZ的博客 Xpath 是高效简单，在XML文档中搜索内容的一门语言，最初是用来搜寻 XML 文档的，但是HTML语言是XML的一个子集，它同样适用于...在Python爬虫中，我们经常通过安装lxml库，利用xpath解析这种高效便捷的方式来提取信息。
python爬虫之xpath解析(附实战)
2020-07-10 18:23

猛男技术控的博客 xpath是学爬虫的必备工具，其选择功能十分强大，它提供了非常简明的路径选择表达式，另外，它还提供了超过100个内建函数，用于字符串、数值、时间的匹配以及节点、序列的处理等，几乎所有我们想要定位的节点，都可以...
python（xpath爬虫）实例
2023-05-21 17:31

！continue！的博客本文主要介绍xpath爬虫相关原理，及xpath爬虫实例。
Python爬虫——HTML中Xpath定位
2024-12-06 22:45

伊一大数据&人工智能学习日志的博客学习Xpath爬虫
Python爬虫课程作业，requests+xpath学习
2023-05-08 11:44

能学到什么：Python爬虫基础，requests基础，xpath数据提取。适用人群：软件开发与爬虫学习人群，具有一定的编程技术使用场景：爬虫学习与研究阅读建议：此资源在于综合学习Python爬虫技术，不仅是代码编写实现也...
【Python网络爬虫笔记】11- Xpath精准定位元素
2024-12-13 10:53

zi__you的博客 Xpath，能够帮助开发者从复杂的网页结构中精准地提取所需信息。本文将深入探讨 Xpath 在 Python 网络爬虫中的作用、常用方法、安装与使用步骤以及典型案例。
Python爬虫技术第16节 XPath
2024-07-26 18:30

hummhumm的博客 XPath是一种在XML文档中查找信息的语言，尽管XML和HTML在语法上有区别，但XPath同样适用于HTML文档的解析，尤其是在使用如lxml这样的库时。XPath提供了一种强大的方法来定位和提取XML/HTML文档中的元素和属性。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月16日

xpath爬虫小说正文爬不到

2条回答 默认 最新

问题事件

2条回答默认最新