C#，使用xpath 无法采集网页内容

采集网址：https://www.taoguba.com.cn/Article/2523033/1

需采集内容：

图片说明

使用HtmlAgilityPack

时间xpath:
1、/html/body//span[contains(concat(' ', normalize-space(@class), ' '),' p_tatime ')]

2、//*[@id='new_wrap_container']/DIV[1]/DIV[2]/SPAN[2]

3、//SPAN[@class='p_tatime']

用上述xpath使用谷歌浏览器的xpath helper插件都可以采集到信息，但C#采集到的html都无法采集到时间。
请问哪位可以给个demo，C#实现的，能采集到标红的时间及文字内容

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
wiledog 2019-07-17 18:52
关注
使用浏览器得到的xpath 中有一条为//SPAN[@class='p_tatime']，

该路径无法采集到时间信息，改为//span[@class='p_tatime']_可正确采集时间信息。

所以浏览器得到的xpath有时需要修改。

另外特别感谢：贵阳挖掘机马善福

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

C#，使用xpath 无法采集网页内容 c#
2019-07-14 10:23

回答 2 已采纳使用浏览器得到的xpath 中有一条为//SPAN[@class='p_tatime']，该路径无法采集到时间信息，改为//span[@class='p_tatime']_可正确采集时间信息。
C#，使用xpath 无法采集网页内容，我发的问题为什么被删了？ c#
2019-07-14 16:03

回答 1 已采纳可能被系统误判为导流广告删除了
C#使用HtmlAgilityPack 获取xpath节点时出错 c# html5
2018-11-07 07:35

回答 1 已采纳 https://blog.csdn.net/heyangyi_19940703/article/details/78352378
使用 Playwright 和 C# 自动化采集亚马逊网站的商品信息和评论
2023-04-11 14:04

亿牛云爬虫专家的博客 Playwright 由微软开发，可以实现跨浏览器的网页自动...这样，就可以使用 Playwright 和 C# 语言来自动化和采集基于 Chromium 的亚马逊网页和评论数据了。这可以提高采集数据的效率，同时也可以降低被网站屏蔽的风险。
使用XPath访问子段落内容 php
2018-05-19 20:25

回答 1 已采纳 $ptext = $finder->query('//div[contains(@class, "b-list-fact__item-explanation js-fact-explanat
使用xpath从网页刮取特定文本 html php
2017-10-04 21:55

回答 1 已采纳 For that particular website, the versions are being loaded from JSON data client side, you won't f
C# xpath SelectNode匹配到的节点找不到父节点 c# xml
2018-04-07 14:28

回答 2 已采纳每次都删除0？是不是你写错了。如果已经删除了，又执行了，就会出错。
常见的一些C#开源框架或者开源项目
2019-08-16 16:46

张云勇的博客 Json.Net 是一个读写Json效率比较高的.Net框架.Json.Net 使得在.Net环境下使用Json更加简单。通过Linq To JSON可以快速的读写Json，通过JsonSerializer可以序列化你的.Net对象。让你轻松实现.Net中所有类型(对象,...
使用XPath将dom内容正确分类到Array中 php
2018-05-20 10:36

回答 1 已采纳 I think it would be easier to start by selecting all the parent <div class"classX"> elements
使用Xpath进行部分匹配 php xml
2019-04-18 17:12

回答 2 已采纳 A few errors here: use of and instead of or, assuming searches are case-insensitive, and passing i
使用xpath从background-image样式属性中提取值 php
2017-11-01 05:47

回答 1 已采纳 1) You lost quotes wrapping xpath - it's string. 2) with dom xpath, query returns set of nodes w
C#常用开源框架
2020-02-10 15:11

超级松林的博客 Json.Net 是一个读写Json效率比较高的.Net框架.Json.Net 使得在.Net环境下使用Json更加简单。通过Linq To JSON可以快速的读写Json，通过JsonSerializer可以序列化你的.Net对象。让你轻松实现.Net中所有类型(对象,...
使用php获取网页XML代码并在其上使用XPATH php xml
2017-03-30 05:27

回答 1 已采纳 Here's converted code to Xpath query. <?php $text = $_REQUEST['text']; $xmlId = 'https://euti
python爬虫第7天穿越网页表单与登录窗口进行采集采集JavaScript
2018-02-18 18:17

qq_41471281的博客那些使用了 Ajax 或 DHTML 技术改变 / 加载内容的页面，可能有一些采集手段，但是用 Python 解决这个问题只有两种途径：直接从 JavaScript 代码里采集内容，或者用 Python 的第三方库运行 JavaScript，直接采集你在...
21.9 Python 使用Selenium库
2023-10-27 16:02

微软技术分享的博客它可以模拟用户在浏览器中的操作，如打开网页、点击链接、填写表单等，并且可以在代码中实现条件判断、异常处理等功能。Selenium最初是用于测试Web应用程序的，但也可以用于其他用途，如爬取网站数据、自动化提交...
没有解决我的问题, 去提问

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘