可以爬取页面，但无法爬取子标签

想问一下大家，我在爬虫的时候发现我能爬取页面，但是页面下的子标签爬取后返回为空是为什么？

希望爬取的标签为：

代码：

如图a可以输出，结果为：

但b输出结果为空：

想问一下这是为什么

源代码如下：

from bs4 import BeautifulSoup
import requests
import pandas as pd
import requests
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

#测试样例
link_href2="http://ipr.mofcom.gov.cn/hwwq_2/chn_eu_gi/dlbzSearchList.html?name=阿克苏苹果&area_ids=&pro_type_one=&pro_type_two="
# 定制请求，发送请求并返回响应对象和html文档
request2 = requests.get(link_href2)
request2.encoding=request2.apparent_encoding#显示中文
html=request2.text
soup2=BeautifulSoup(html,'html.parser')#解析网页内容，指定BeautifulSoup解析器为'html.parser'
a=soup2.find(attrs={"id":"dataList"})
b=a.find_all('p')
#c=soup2.select('#dataList > ul > li > p:nth-child(2) > span')
#soup2.xpath('//*[@id="dataList"]/ul/li/p[1]/span')
print(a)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阳光宅男xxb 2023-04-25 08:42
关注
因为你爬取的结果中的html被注释掉了：

那个是html中的代码注释符号，导致soup解析不到

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

爬取数据html页面时标签之间的内容没有了 python 有问必答
2021-05-17 16:12

回答 5 已采纳可能页面是异步加载的，要F12分析页面数据加载的链接参数传递，对数据进行post或get,参考https://blog.csdn.net/qq_38396897/article/details/823
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
Scrcpy框架爬取58同城，编程语言是Python
2021-04-29 01:05

因此，在实际爬取过程中，我们还需要考虑如何应对这些挑战，比如设置合适的延时、使用代理IP、随机化User-Agent等。最后，分享和交流代码是促进技术进步的好方式，但同时也需尊重他人的劳动成果和版权。使用他人的...
怎么爬取a标签下的i标签 python
2021-10-12 17:41

回答 2 已采纳把 a 改成 i 就行了有用望采纳
scrapy下爬虫爬取子页面详细信息部分代码出错 python 爬虫
2021-12-07 21:42

回答 1 已采纳流程通了细节没改 import copy from scrapy import Request from scrapy.spiders import Spider class AniRank(S
爬取页面信息中间有广告导致返回None python 有问必答爬虫
2022-09-15 22:20

回答 3 已采纳判断为none continue继续下一个循环
书评爬取_网页爬取_
2021-09-30 13:44

对于分析部分，我们可以利用NLP（自然语言处理）技术对书评进行情感分析，了解读者对书籍的总体评价。可以使用jieba进行中文分词，然后通过TextBlob或自定义模型计算情感极性和强度。此外，还可以统计高频词汇，找出...
python怎么爬取百度百科上canvas标签的图片 python
2018-12-03 07:20

回答 3 已采纳也就是爬取动态图片吧 # coding = utf-8 import urllib.request import re import requests def getDatas(
小白求助：请问怎么爬取img标签下的src地址？ python
2020-09-20 17:33

回答 4 已采纳 import requests from lxml import etree url = "https://www.gooood.cn/sl_release-apartment-by-pascal
爬取有道翻译时更改data为何更改不了语言？ python 有问必答
2021-08-12 10:27

回答 2 已采纳 headers={ 'Accept':'application/json, text/javascript, */*; q=0.01', 'Accept-Encoding':'gzip, defla
使用Selenium爬取网络页面
2024-08-13 20:32

富士达幸运星的博客 elenium 是一个功能强大的工具...通过本文的指南，你可以开始使用 Selenium 进行网络页面爬取，并逐步掌握更多高级技巧。无论是数据分析、测试自动化还是其他自动化任务，Selenium 都能帮助你提高效率，减少重复劳动。
爬取数据一直增加的页面 python
2020-12-29 10:53

回答 2 已采纳把所爬具体文章url存入文本，或仅存最后次url。下一次开始时先判断页面是否包含最后次url，即有存在列表中哪个位置。
微博热搜数据爬取与分析
2024-07-12 18:11

- **数据爬取**：利用Python编程语言和相关的网络爬虫库（如Scrapy、Requests等），编写脚本自动抓取微博热搜榜的数据。 - **数据清洗**：对爬取到的数据进行预处理，去除无效或重复的信息，确保数据质量。 - **数据...
Python爬取小说源代码，Python实现小说自由
2022-12-26 10:20

本项目名为"Python爬取小说源代码，Python实现小说自由"，旨在利用Python编程语言来自动化下载网络小说，实现无需在线阅读即可拥有全部章节内容的目标。通过这个项目，我们可以学习到以下几个关键的Python爬虫知识点...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月11日

悬赏问题

¥15 Opencv（C++）异常
¥15 VScode上配置C语言环境
¥15 汇编语言没有主程序吗？
¥15 这个函数为什么会爆内存
¥15 无法装系统，grub成了顽固拦路虎
¥15 springboot aop 应用启动异常
¥15 matlab有关债券凸性久期的代码
¥15 lvgl v8.2定时器提前到来
¥15 qtcp 发送数据时偶尔会遇到发送数据失败？用的MSVC编译器(标签-qt|关键词-tcp)
¥15 cam_lidar_calibration报错

可以爬取页面，但无法爬取子标签

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新