为什么我想爬取所以得页面最后只打印出来最后一页得

import requests
from bs4 import BeautifulSoup
import pandas as pd


def method_name():
    # url = 'http://www.tianqihoubao.com/aqi/xingtai-202102.html'
    years = ['2013','2014', '2015', '2026','2017','2018', '2019', '2020']
    months = ['1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12']
    # for i in years:
    #     for j in months:
    #         a = 'http://www.tianqihoubao.com/aqi/xingtai-'+str(i)+str(j)+'.html'
    #         print(a)
    #         pass
    #     pass
    # for i in years:
    #     for j in months:
    #         a = 'http://www.tianqihoubao.com/aqi/xingtai-{}{}.html' .format(i,j)
    #         print(a)
    #         pass
    #     pass


    for i in months:
        a = 'http://www.tianqihoubao.com/aqi/xingtai-2019{}.html' .format(i)
        print(a)

    global tr_list
    resp = requests.get(a)
    html = resp.content.decode('gbk')
    # 数据提取
    soup = BeautifulSoup(html, 'html.parser')
    tr_list = soup.find_all('tr')
    print(tr_list)


#获取网页源代码
method_name()

dates,conditions,temp,paiming= [],[],[],[]
pm10,So2,No2,Co,O3 = [],[],[],[],[]
for data in tr_list[1:]:
    sub_data = data.text.split()
    dates.append(sub_data[0])
    conditions.append(''.join(sub_data[1]))
    temp.append(''.join(sub_data[2]))
    paiming.append(''.join(sub_data[3]))
    pm10.append(''.join(sub_data[4]))
    So2.append(''.join(sub_data[5]))
    No2.append(''.join(sub_data[6]))
    Co.append(''.join(sub_data[7]))
    O3.append(''.join(sub_data[8]))
_data = pd.DataFrame()
_data['日期'] = dates
_data['质量等级'] = conditions
_data['AQI指数'] = temp
_data['当天AQI排名'] = paiming
_data['PM10'] = pm10
_data['So2'] = So2
_data['No2'] = No2
_data['Co'] = Co
_data['O3'] = O3
print(_data)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

为什么我的python爬取内容只显示最后一个数据，如果可以，希望附改正解决代码！ python 爬虫
2022-08-09 13:39

回答 3 已采纳
python for循环只爬取最后一页的内容 python 有问必答爬虫
2021-10-18 19:17

回答 2 已采纳代码这样修改一下，应该可以，代码中为了测试将Item写成了一个类，你可以去掉它，用导入语句： import scrapy class MovieItem(scrapy.Item): name=
为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
Python爬取大众点评 50 页数据，什么都一清二楚啦！
2020-05-12 14:48

工程师大胖的博客首先笔者定位为成都，美食类型选的“火锅”，火锅具体类型选的不限，区域选的不限，排序选的智能，如图：你也可以选择别的选项，只是注意URL的变化。本文都是按照上述选项爬取的数据。接下来翻页观察一下URL的变化...
为啥我代码只爬取了最后一个月的天气啊 python 有问必答爬虫
2021-10-19 15:09

回答 3 已采纳主要是网址构造错误，str(page)在获取月份为个位数是构造出来的不是有效网址。应该写成如下代码即可： import requests from bs4 import BeautifulSoup i
请问为什么当我试图储存爬到的多个页面的数据时，只能保存最后一页的数据 python
2020-01-11 23:17

回答 1 已采纳我把你写的爬虫代码给简单改了下，用正则匹配你这个写的有问题，后期需要加强下正则学习，我用lxml解析的源代码，因为你写的是同步执行的，所以我也是同步执行的，没有改成异步的，这样爬虫用异步方式是最好的
python爬取码市导入excel中导入结果只导入最后一条的问题 python 数据分析爬虫
2021-08-15 19:24

回答 3 已采纳修改了一下程序，有帮助的话，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: Roc-xb """ import requ
python爬取豆瓣读书_Python用16行代码就搞定了爬取豆瓣读书页面
2020-11-30 11:06

weixin_39627751的博客我们一直说Python比较简单，代码体量没有别的程序那么大，对于初学者，尤其是零编程基础的初学者来说，感触没有那么明显，那么今天就让你见识一下：爬取豆瓣读书页面，Python用16行代码就搞定了!python+selenium这个...
为什么爬取的网站，页面代码少了好多，然后网站显示空白 python 有问必答爬虫
2022-02-19 20:26

回答 3 已采纳你是用requests爬取网页的吗你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用s
使用requests 获取博客园每页内容时，为什么一直重复爬取第一页内容？感谢大佬 python 有问必答
2021-04-03 09:45

回答 4 已采纳问题出在urls构造上，第一页和后续网页的地址是不一样的，将这行改为：urls = [f'https://cnblogs.com/#p{page}' if page == 1 else f'https
爬取豆瓣电影top250最后只保留了一行数据，代码没出错 python 有问必答
2021-06-08 18:01

回答 3 已采纳 #保存数据 with open(r"书单",'a+',encoding="utf-8")as f: f.write("{},{},{},{}".format(title,rating_nu
python爬取豆瓣读书简单_Python用16行代码就搞定了爬取豆瓣读书页面
2020-12-04 06:38

weixin_39870413的博客我们一直说Python比较简单，代码体量没有别的程序那么大，对于初学者，尤其是零编程基础的初学者来说，感触没有那么明显，那么今天就让你见识一下：爬取豆瓣读书页面，Python用16行代码就搞定了! python+selenium这...
为什么这个python代码只能抓取豆瓣top250最后一页的内容 python 有问必答
2021-08-06 14:39

回答 2 已采纳因为解析语句没有在for循环当中，下面这样就可以有帮助，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: YangPC @QQ:3
爬取你的第一个网页
2021-06-15 14:03

AI悦创|编程1v1的博客从本篇开始，我们正式开始学习 Python 网页爬虫的相关知识。...无论怎样，在正式学习网页爬虫的相关文章中，我都会力求详细，对一些之前没有讲解过、讲解的不够细致的点再次复习，将 Python 网页...
python爬取豆瓣读书简单_Python用16行代码就搞定了爬取豆瓣读书页面！
2020-12-04 06:38

weixin_39846289的博客我们一直说Python比较简单，代码体量没有别的程序那么大，对于初学者，尤其是零编程基础的初学者来说，感触没有那么明显，那么今天就让你见识一下：爬取豆瓣读书页面，Python用16行代码就搞定了!python+selenium这个...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

码龄粉丝数原力等级 --

为什么我想爬取所以得页面最后只打印出来最后一页得

0条回答默认最新

悬赏问题

为什么我想爬取所以得页面 最后只打印出来最后一页得

0条回答 默认 最新

悬赏问题

为什么我想爬取所以得页面最后只打印出来最后一页得

0条回答默认最新