爬取网易新闻首页广告图片超链接，输出一直为空。

from requests_html import HTMLSession
session = HTMLSession()
url = 'https://news.163.com/'
r = session.get(url)
print(r.html.text)
r.html.links

sel='//*[@id="index2016_wrap"]/div[1]/div[2]/div[2]/div[1]/div/iframe/html/body/a'
results = r.html.xpath(sel)  
//这里也试过使用selector，调用html.find()，但是输出也是空
print(results)

https://news.163.com/
网上查了以后发现可能是因为直接从谷歌浏览器复制的selector、xpath和爬虫爬到的不一样。有没有解决这个问题的方法呢？
也有尝试过想用正则表达式，但是实在看不懂。
要爬取的是网易新闻首页广告的超链接。不知道为什么在图片上html代码最上面标签为iframe的那一行复制出来的路径是绝对路径，再往下就是相对路径了。我直接在标签为a的那行复制出来的是body>a。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lshen01 2023-03-17 02:42
关注
参考GPT和自己的思路：

首先，使用复制出来的selector和xpath可能会因为网页结构变动而失效，所以最好手动编写。其次，该页面的广告很可能是通过JS动态加载的，所以需要等待页面加载完成后再尝试爬取。

以下是一个可以爬取页面广告链接的示例代码：

```
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

使用selenium打开页面

url = 'https://n/

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

html点击指向本页的超链接之后左上角的图片消失了. css
2022-05-19 20:56

回答 1 已采纳 #logo{ position: absolute; left: 0; top: 0; }
超链接如何过滤掉get请求，只留下post请求，解决空指针问题 java spring boot 前端
2022-07-30 20:14

回答 1 已采纳浏览器只能用 get请求啊，又不是表单你可以在点击 1.html -> 2.html中请求改成get，而参数不要用data ：xx 传直接在url:'./li1.html ?' data= "
图片里面加文字加超链接，打完，只有图片哪里出错了 css html html5
2022-06-22 18:56

回答 3 已采纳 <footer> <div class=news-img"> <a href=""> <img src="./img/lf6s.jp
如何利用python爬取网易新闻
2024-04-16 04:29

好像要长脑子了1的博客网页绚丽多彩，美轮美奂，如同一幅水彩画。爬取数据首先需要知道所需要抓取的数据是怎样的呈现的，就像学作一幅画，开始前你要知道这幅画是用什么画出来的，铅笔还是水彩笔…
怎么在图片上添加超链接 css css3 html5
2023-04-13 00:05

回答 4 已采纳 1.div设置背景图,a链接为子元素。然后设置一下位置2. 使用相对定位 a 链接和图片在同一个父元素下
PHP将sql输出更改为超链接 php sql
2015-06-07 11:04

回答 1 已采纳 Change this <td>{$row->columns("Link")->value()}'</td> to <a href='{$r
markdown中如何使超链接居中 html 前端
2023-01-07 11:13

回答 1 已采纳语法问题，网页链接需要在引号里，还有单词错误，应该是href <center> <a href="https://markdown.jianguoyun.com/3381.html"
Node.js实现网络新闻爬虫及搜索功能（一）
2021-04-30 04:46

WORLDLOGIC的博客爬取并解析网页首页4. 爬取并解析新闻URL Node.js实现网络新闻爬虫及搜索功能（一）项目要求一、爬虫部分 1、完成目标网站的网页分析和爬虫设计。 ...
如何设置超链接，点击图片可以在新窗口打开 c++ html java
2022-12-09 11:37

回答 2 已采纳要在 HTML 页面中设置图片的超链接，可以使用以下代码： <a href="http://www.xueyuan.com" target="_blank"> <img src=
Edge浏览器点击超链接后如何跳回？ edge webpack 前端
2022-05-16 10:16

回答 1 已采纳在点开的时候按住ctrl再单击从根源解决问题，这样你的参考文献和论文就可以同时显示了。这种不跳回的情况好像是没办法的。
将原始超链接转换为img php
2019-05-01 11:57

回答 1 已采纳 use <img> tag with src <div class="sub_text text_small pro_text"><img src="<?ph
如何利用python爬取网易新闻(2)
2024-04-16 04:29

2401_84009300的博客 HTML是用来描述网页的一种语言JSON是一种轻量级的数据交换格式爬取网页信息其实就是向网页提出请求，服务器就会将数据反馈给你2. 获得动态加载源码导入需要的用的模块和库：from selenium.webdriver.common.action_...
js问题：怎么将js伪装的超链接返回为超链接 javascript 爬虫
2022-03-15 20:11

回答 2 已采纳用js动态生成页面啊
如何利用python爬取网易新闻(1)
2024-04-16 04:28

2401_84009215的博客爬取网页信息其实就是向网页提出请求，服务器就会将数据反馈给你2. 获得动态加载源码导入需要的用的模块和库：from selenium.webdriver.common.action_chains import ActionChains #引入ActionChains鼠标操作类。
新闻爬虫及爬取结果查询网站的搭建（一）
2020-05-06 16:47

胡萝卜嫁接豆角的博客新闻爬虫及爬取结果查询网站的搭建核心新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右...
没有解决我的问题, 去提问

悬赏问题

¥15 扩散模型sd.webui使用时报错“Nonetype”
¥15 stm32流水灯＋呼吸灯＋外部中断按键
¥15 将二维数组，按照假设的规定，如0/1/0 == "4"，把对应列位置写成一个字符并打印输出该字符
¥15 NX MCD仿真与博途通讯不了啥情况
¥15 win11家庭中文版安装docker遇到Hyper-V启用失败解决办法整理
¥15 gradio的web端页面格式不对的问题
¥15 求大家看看Nonce如何配置
¥15 Matlab怎么求解含参的二重积分？
¥15 苹果手机突然连不上wifi了？
¥15 cgictest.cgi文件无法访问

爬取网易新闻首页广告图片超链接，输出一直为空。

1条回答 默认 最新

使用selenium打开页面

悬赏问题

1条回答默认最新