[python]BeautifulSoup4爬虫解析网页中data-*标签的问题

图片说明
我想要解析出图中的链接，通过先识别 li 定位。可是查看soup的文本，所有data-* 都没有解析出来
代码如下

 keywords = input('输入关键词PLZ')
res = requests.get('https://www.bing.com/search?q='+str(keywords)+'&qs=n&form=QBLH&scope=web&sp=-1&pq=abc&sc=8-5&sk=&cvid=3FE7B447AE744DD1AF25B5919EE1B675')
try:
    res.raise_for_status()
except Exception as ecp:
    print('There is an Exception:',ecp)

soup = bs4.BeautifulSoup(res.text,'html.parser')
ol = soup.find('ol',id='b_results')
linkElement = soup.find_all(attrs={'data-bm':'7'})

结果linkElement为空

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2017-05-17 08:26
关注
先看你的soup 中拿到了什么数据，怀疑API返回的内容是异步的，你没有拿到网页的内容。如果这样，你需要用selenium等webdriver方式去拿页面内容

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
Python网络爬虫如何跳过"This request has no response data aviliable"的网页 json python
2022-04-17 18:27

回答 1 已采纳在你出错的地方加个try，except，如果错误了直接return，
关于#python爬虫#的问题：TypeError python 爬虫
2022-10-23 22:38

回答 2 已采纳 urlopen里面的逗号改为.是.format有帮助的话采纳一下哦！
Python爬虫初级（3）：BeautifulSoup解析网页
2021-06-21 00:23

一北DMY的博客 Python爬虫初级（3）：BeautifulSoup解析网页
如何使用python爬虫从企查查上获得专利文献内容？ python windows 有问必答爬虫
2021-12-18 11:16

回答 2 已采纳题主要的代码如下， from bs4 import BeautifulSoup import requests header = {"user-agent":"Mozilla/5.0.html (
python爬虫如何取出定位标签下的所有子集文本 python
2021-03-27 16:46

回答 1 已采纳将原代码中这段内容： for j in page_spec_data: for k in j.a: # print(k.string) value_word
为什么python爬虫的结果存储不到MySQL中？ mysql python
2022-06-21 19:56

回答 2 已采纳可能你根本没爬取到
python网页解析库_Python 爬虫之网页解析库 BeautifulSoup
2020-12-02 13:12

weixin_39759890的博客 imageBeautifulSoup 是一个使用灵活方便、执行速度快、支持多种解析器的网页解析库，可以让你无需编写正则表达式也能从 html 和 xml 中提取数据。BeautifulSoup 不仅支持 Python 内置的 Html 解析器，还支持 lxml、...
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
新手python爬虫出来是404，User-Agent写上了 python 有问必答
2021-04-11 23:30

回答 3 已采纳你的这个baseurl 我用浏览器去访问都是404 更别说是爬虫了
Python BeautifulSoup获取属性值怎么? python
2019-09-20 15:38

回答 1 已采纳 ``` from bs4 import BeautifulSoup html='' soup=BeautifulSoup(html,'lxml') imgs=soup.sele
Python从入门到入土-网络爬虫(BeautifulSoup、lxml解析网页、requests获取网页）
2022-09-26 09:22

共饮一杯无的博客 Python从入门到入土-网络爬虫(BeautifulSoup、lxml解析网页、requests获取网页）
python爬虫只能获得一条数据 python 爬虫
2022-08-23 18:15

回答 1 已采纳复制我的代码试试： import requests from bs4 import BeautifulSoup def get_page(link): headers = {'User-Ag
Python爬虫：BeautifulSoup解析静态HTML页面【附完整代码】
2022-09-27 16:37

Java Punk的博客通过本篇，你将学会破解【身份鉴别】类的反爬虫程序，并利用 BeautifulSoup 解析静态的HTML页面，还有使用 xlwt 插件操作 Excel。
使用Python爬虫和BeautifulSoup库从网页抓取中文文本
2023-09-05 18:52

沁致中的博客但是，通过使用Python的requests和BeautifulSoup库，我们可以轻松地处理大多数的网页，并从中抓取我们需要的中文文本。我们将通过一个具体的示例来展示这个过程，该示例将从"在这个示例中，我们关注的是id为...
没有解决我的问题, 去提问

悬赏问题

¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘
¥15 perl MISA分析p3_in脚本出错
¥15 k8s部署jupyterlab，jupyterlab保存不了文件
¥15 ubuntu虚拟机打包apk错误
¥199 rust编程架构设计的方案有偿
¥15 回答4f系统的像差计算
¥15 java如何提取出pdf里的文字？

[python]BeautifulSoup4爬虫解析网页中data-*标签的问题

2条回答 默认 最新

悬赏问题

2条回答默认最新