python爬虫中用xpath总是获取不到内容，希望大家帮我看看这两个网页中所需内容如何定位？谢谢~

用python爬虫，代码用xpath总是获取不到内容，希望大家帮我看看这两个网页中所需内容如何定位？

1.想要获取下面网址中的债券基本信息，试了很多xpath的路径都失败了，都是空的_(¦3」∠)_，下面贴出测试用的代码，希望大家能帮我看下xpath那部分为什么不对（倒数第二行），也可能是其他问题o(╥﹏╥)o

import requests
from lxml import html

url = 'http://www.chinamoney.com.cn/chinese/zqjc/?bondDefinedCode=1000040278'
page = requests.Session().get(url) 
 tree = html.fromstring(page.text)
result = tree.xpath('//tbody//tr//th/text()')    
print(result)

2.想要获取下面网址中的一个href属性（截图中阴影部分，就是查询结果的网址），也试了很多xpath的路径也都失败了，不知道@href前应该写什么。
图片说明

url = 'http://www.chinamoney.com.cn/chinese/qwjsn/?searchValue=14中关村集MTN001'

第一次提问，有什么不合适的希望谅解，工作需要，时间比较急切，麻烦大家了。━((*′д｀)爻(′д｀*))━!!!!

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
今天学会了没？没呢 2019-03-27 20:41
关注
要爬取的是中国货币网上的内容，发现不是静态网页，最后找到了request返回包含json数据的url，得到了所需的信息~

r = requests.get(url) print(r.json(),file=data)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬虫中用xpath总是获取不到内容，希望大家帮我看看这两个网页中所需内容如何定位？谢谢~ python
2019-03-27 09:11

回答 2 已采纳要爬取的是中国货币网上的内容，发现不是静态网页，最后找到了request返回包含json数据的url，得到了所需的信息~ ``` r = requests.get(url) pr
python如何用xpath取两个标签之间的内容 python 爬虫
2022-05-18 17:43

回答 3 已采纳 //span[text()="名字:"]/following::a[position()<count(//span[text()="名字:"]/following::a)-count(//spa
python+selenium+xpath如何定位网页table表格中的数据 python selenium 有问必答爬虫
2022-02-25 12:44

回答 2 已采纳使用last()定位最后一个tr节点，再用索引获取。示例： from lxml import etree with open('a.html','r',encoding='utf-8') as f:
Python爬虫十六式 - 第四式: 使用Xpath提取网页内容
2019-01-10 18:02

Connor_Zhang的博客 Hello，大家好，我是Connor，一个从无到有的技术小白。上一次我们说到了 requests 的使用方法。到上节课为止，我们已经学完了所有的 Python 常用的访问库。那么当我们获取到了访问的内容之后，我们就应该从网页...
爬虫xpath获取不到数据 python 爬虫
2022-12-12 01:38

回答 2 已采纳数据有可能是动态加载的，你没有爬到，先打印整个页面内容，搜索一下看有没有你需要的内容，没有的话，那内容就是动态加载的，request肯定爬取不到，那xpath肯定就提取不了呗！1.对于动态加载的数据，
xpath爬取图片，得不到src ，python求解决 python 有问必答爬虫
2022-01-27 12:25

回答 4 已采纳图片是js解析出来的，xpath无效，数据在js变量里面，正则提取下数据用json.loads加载获取代码如下 import requests import re import json def
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python如何用xpath爬取指定内容_python爬虫：用request最简单的代码爬取图片，以及XpathHelper的使用...
2020-12-17 16:09

weixin_39915210的博客最近这段时间自己一直在学习数据分析这一块，其中...首先来看爬取图片的布骤：1、抓取网页url2、找到自己想要爬取的内容，并解析内容(这里是所有布骤最难的)3、保存图片包括(文件夹的路径，图片名称)4、翻页爬取学...
xpath如何获取同级两个不同名称标签下的内容呢？爬虫
2022-07-13 10:40

回答 2 已采纳分开爬取吧，然后写个循环对文本进行拼接这是最简单的，对整个header更麻烦
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python爬虫,我该怎么获取想要的内容（映射练习） css python 有问必答爬虫
2021-12-25 21:31

回答 1 已采纳因为题主将css中的空格全部替换掉了，但是正则中还有空格，并且正则分组用()，不是{}，而且svg中没有span标签，是text改下面就可以了 import re import requests fr
python爬虫利器之xpath_在EXCEL中使用Python爬虫利器Xpath爬取网页中的元素
2020-12-03 15:17

weixin_39901077的博客上一篇介绍了如何在EXCEL中用正则表达式抓取网页中的信息,文章链接:用EXCEL像Python一样优雅的抓取网页中的信息，但有的人说，正则表达式那么难我不会啊，VBA太难我也不会，不想编程，有没有更简单的方法。...
python爬虫如何垂直爬取网页内容？ python 开发语言爬虫
2021-11-29 19:12

回答 1 已采纳 img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名
【Python爬虫开发基础⑧】XPath库及其基本用法
2023-06-27 13:18

为梦而生~的博客 XPath（XML Path Language）是一种用于在HTML和XML文档中定位和选择节点的语言。...路径表达式：XPath使用路径表达式从根节点开始，沿着节点之间...(两个点)表示当前节点的父节点。nodeName表示选择指定名称的节点。谓语。
关于python使用xpath爬取网页内容返回值为空列表的解决方法
2022-06-20 07:25

是半道呀的博客在使用XPath爬取网站中遇到的写完代码发现运行后返回值为 [] 空列表解决方法：1、首先看看你的这段代码中是否有 "tbody"存在，把"tbody"去掉为什么呢？因为在用xpath解析网页的时候，会遇到tbody标签。tbody...
没有解决我的问题, 去提问

悬赏问题

¥100 c语言，请帮蒟蒻写一个题的范例作参考
¥15 名为“Product”的列已属于此 DataTable
¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）