关于Beautiful soup findall()函数抓取天气网站历史天气的问题

网页源代码，想要爬取历史天气

爬取代码如图↑

运行结果如图↑
为什么会带上这个结束标签呢？用了find()函数居然得到了一样的结果，而且find函数搭配string显示None，说明这个标签里嵌了不止一个子标签？怎么去掉标签！！求问

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-10-17 04:28
关注
请求返回的就是一个带td等标签（表格格式数据）的json数据，可用字符串方法进行处理，推荐使用pandas的read_html去读取表格更为简便，用如下方式解决：

for url in urls: seconds=random.randint(1,5) res=requests.get(url,headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38'}) res.encoding=res.apparent_encoding time.sleep(seconds) js=res.json() df=pd.read_html(js['data'])[0] print(df)

运行结果：

日期 ... 空气质量指数 0 2021-05-01 周六 ... 52 良 1 2021-05-02 周日 ... 38 优 2 2021-05-03 周一 ... 45 优。。。

如对你有帮助，请点击我回答右上角【采纳】按钮采纳支持一下。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

关于Beautiful soup findall()函数抓取天气网站历史天气的问题 python 有问必答
2021-10-16 23:53

回答 2 已采纳请求返回的就是一个带td等标签（表格格式数据）的json数据，可用字符串方法进行处理，推荐使用pandas的read_html去读取表格更为简便，用如下方式解决： for url in urls:
soup.find_all返回了空列表 list python
2022-04-11 19:59

回答 1 已采纳先打印soup看看是不是空,不行在用下面这句soup.find_all('div',attrs={"class":"item"})我看着你那样写没错的，我觉得可能soup就是空的
python爬虫：soup.select（）抓取信息路径表达问题 python
2019-07-02 18:16

回答 1 已采纳没用过select，但看样子是这样用的 ``` from bs4 import BeautifulSoup import requests url = 'http://bj.xiaozhu
python soup findall_BeautifulSoup库findAll()、find()方法详解
2020-12-08 21:41

weixin_39714849的博客 find()和findAll()官方定义如下：findAll(tag, attributes, recursive, text, limit, keywords)find(tag, attributes, recursive, text, keywords)95%的时间只用前2个参数：tag，attributes。tag可以传一个标签的...
用Python爬取智慧树问题时，没办法入到soup.find_all（）的for循环中 python
2021-08-27 15:54

回答 1 已采纳因为你数据没有抓取到, 所以打印没输出
请求中加上headers后soup.find_all返回空列表 python 爬虫
2023-03-06 02:40

回答 2 已采纳说明您设置的这个j_thread_list clearfix thread_item_box值不正确，当获取不正常的时候有这个值，获取正常的时候没有这个个值，建议重新定位下元素。以及在获取到的页面内容
find_all函数index异常 list python 正则表达式
2021-01-26 17:29

回答 1 已采纳 doms = soup.find_all(class_="user_reviews_count") if len(doms)>0: for m in doms[0]:
Python利用Beautiful Soup模块修改内容方法示例
2020-09-21 09:46

BeautifulSoup提供了多种方法进行查找，如`find()`, `find_all()`, `select()`, `descendants`, `children`等。这些方法可以帮助你精确地定位到需要修改的元素。 6. **递归遍历与修改**：如果文档结构复杂，可能...
关于#python#的问题，请各位专家解答！ python 爬虫
2023-03-01 22:24

回答 2 已采纳应该是Judge = re.findall(findJudge, item)[0]中正则匹配re.findall(findJudge, item)结果是空列表，用[0]读取的时候提示索引越界了。可修改
关于#python#的问题：python爬虫爬取百度图片 python 有问必答爬虫
2021-11-27 22:00

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
关于#python#的问题，如何解决？ python 爬虫
2023-03-07 17:40

回答 3 已采纳 “Devil组”引证GPT后的撰写：这个错误是由于文件写入时使用的默认编码为 'gbk'，而 p.text 中含有无法被 'gbk' 编码的字符。可以将文件的编码格式改为 'utf-8'，这样就可以处
python soup findall_Python使用BeautifulSoup库解析HTML基本使用教程
2020-12-08 21:41

weixin_39675728的博客 BeautifulSoup是Python的一个第三方库，可...准备1.Beautiful Soup安装为了能够对页面中的内容进行解析，本文使用Beautiful Soup。当然，本文的例子需求较简单，完全可以使用分析字符串的方式。执行sudo easy_insta...
python爬虫之数据提取——Beautiful Soup
2020-12-16 16:31

黎明之道的博客 Beautiful Soup提供一些简单的，python式的函数来处理导航、索引、修改分析树等功能。他是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。 ...
Python手记-10：Beautiful Soup爬取豆瓣经典书单
2020-05-11 17:20

山与先生的博客 Beautiful Soup名字来源于《爱丽丝梦游仙境》，是一个可以从HTML或XML文件中提取数据的Python库，当前版本4.4.0，Beautiful Soup 3目前已经停止开发，官方推荐使用Beautiful Soup 4（简称BS4），官文指路：...
万字博文教你python爬虫Beautiful Soup库【详解篇】
2021-07-22 17:14

孤寒者的博客 ????????相信不少小伙伴们通过我的两篇万字博文的轮番轰炸... 第二篇爬虫库requests库详解：两万字博文教你python爬虫requests库，看完还不会我把我女朋友都给你【❤️熬夜整理&建议收藏❤️】 ?????
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月16日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

关于Beautiful soup findall()函数 抓取天气网站历史天气的问题

2条回答 默认 最新

问题事件

悬赏问题

关于Beautiful soup findall()函数抓取天气网站历史天气的问题

2条回答默认最新