python爬取北京市新冠数据，结果显示'NoneType' object has no attribute 'find'


import requests
from bs4 import BeautifulSoup
import pandas as pd
# 主函数
def main():
    # 百度新冠疫情数据网址
    url = 'https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_aladin_banner&city=%E5%8C%97%E4%BA%AC-%E5%8C%97%E4%BA%AC'
    html = getUrlData(url)
    total_data2 = getCitiData(html)
    saveData(total_data2)
    write_data(saveData, 'E:\py 文件\新冠抓取/BeiJing.csv')
    # 获取网页数据
def getUrlData(url):
    try:
        # get请求，设置超时时间
        r = requests.get(url, headers=headers, timeout=30)
        r.raise_for_status
        r.encoding = r.apparent_encoding
        html = r.text
        return html
    except:
        return '发生异常'
# 获取北京市每个区的疫情数据
def getCitiData(html):
    citi_name_data=[]
    new_diagnosis_data=[]
    existing_diagnosis_data=[]
    cumulative_diagnosis_data=[]
    cured_data=[]
    new_cured_data=[]
    dead_data=[]
    new_dead_data=[]
    asymptomatic_data=[]
    new_asymptomatic_data=[]
    total_data=[]
    soup = BeautifulSoup(html,'html.parser')
    data = soup.find('div',attrs={'class':'data-list'})
    # 找到有唯一标识的属性的input标签
    input1 = data.find('input',attrs={'id':'_209'})
    # 找到input标签的的父标签
    div = input1.parent
    # 找到所有的li
    li = div.find_all('li')
    # 遍历li组成的列表
    for i in range(1,len(li)):
        # 获取区名称
        citi_name = li[i].find('div',attrs={'class':'list-city-name'})
        citi_name_data.append(citi_name.string+'区')
        div = li[i].find_all('div',attrs={'class':'list-city-data'})
        # 获取累计确诊人数
        cumulative_diagnosis = div[0].string
        cumulative_diagnosis_data.append(cumulative_diagnosis)
        # 获取新增确诊人数
        new_diagnosis = div[1].string
        new_diagnosis_data.append(new_diagnosis)
        #获取现有确诊人数
        existing_diagnosis = div[2].string
        existing_diagnosis_data.append(existing_diagnosis)
        # 获取累计治愈人数
        cured = div[3].string
        cured_data.append(cured)
        #获取新增治愈人数
        new_cured = div[4].string
        new_cured_data.append( new_cured)
        # 获取累计死亡人数
        dead = div[5].string
        dead_data.append(dead)
        # 获取新增死亡人数
        new_dead = div[6].string
        new_dead_data.append(new_dead)
        #获取累计无症状人数
        asymptomatic =div[7].string
        asymptomatic_data.append(asymptomatic)
        #获取新增无症状人数
        new_asymptomatic = div[8].string
        new_asymptomatic_data.append(new_asymptomatic)
    total_data.append(citi_name_data)
    total_data.append(cumulative_diagnosis_data)
    total_data.append(new_diagnosis_data)
    total_data.append(existing_diagnosis_data)
    total_data.append(cured_data)
    total_data.append(new_cured_data)
    total_data.append(dead_data)
    total_data.append(new_dead_data)
    total_data.append(asymptomatic_data)
    total_data.append(new_asymptomatic_data)
    return total_data
# 保存数据
def saveData(total_data2):
    df2 = data(total_data2)
    # 将爬取的数据保存为csv文件
    df2.to_csv("北京市各区的新冠肺炎疫情数据.csv",encoding='utf-8')
def data(total_data):
    df = pd.DataFrame({'名称':total_data[0],'累计确诊':total_data[1],'新增确诊':total_data[2],'现有确诊':total_data[3],'累计治愈':total_data[4],
                       '新增治愈':total_data[5],'累计死亡':total_data[6],'新增死亡':total_data[7],'累计无症状':total_data[8],'新增无症状':total_data[9]})
    # 将名称列设置为索引列
    df = df.set_index('名称')
    return df
# 程序入口
if __name__== "__main__":
    main()

问题显示

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ritalee11 2022-05-11 22:40
关注
看报错截图，只有38行有类似代码，看看soup 是不是Nonetype

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python：爬虫结果无数据 python
2022-07-26 19:02

回答 1 已采纳你都不先看下你发送到请求返回的值是什么嘛？就直接开始复制粘贴xpath那有这么简单
python爬虫通过xpath无法正常解析欲爬取元素 html python 爬虫
2022-01-04 18:04

回答 2 已采纳我是JAVA的xpath html.xpath("//table[@id='main_table_countries_today']/tbody/tr[@style=' ']").你看着修改下
python的jieba拓展库使用，并用matplotlib和wordcloud生成词云 python
2022-10-22 23:02

回答 1 已采纳首先可以在网上下一个停用词文本：hit_stopwords.txt，然后将你的文章写到一个文本文件“文章.txt”中，代码如下： from collections import Counter imp
Python爬取新冠肺炎实时数据及其可视化分析
2020-12-22 05:28

案例：Python爬取新冠肺炎实时数据及其可视化分析作者：PyQuant 博客：https://blog.csdn.net/qq_33499889 慕课：https://mooc1-2.chaoxing.com/course/207443619.html 本案例适合作为大数据技术基础课程中数据爬取...
爬虫新冠疫情可视化实验报告 python
2021-11-09 23:19

回答 1 已采纳你有具体教程吗
求各位解解这道何时返校 python
2021-10-25 18:07

回答 1 已采纳 m=eval(input('输入月：'))d=eval(input('输入日：'))day=[31,28,31,30,31,30,31,31,30,31,30,31]sum=0for i in ran
[蓝桥杯选拔赛2021.11]新冠病毒 c++
2022-08-29 15:54

回答 1 已采纳 next数组换个名称吧
基于python的新冠肺炎疫情数据可视化及建模预测.zip
2022-11-29 17:26

基于python的新冠肺炎疫情数据可视化及建模预测.zip基于python的新冠肺炎疫情数据可视化及建模预测.zip基于python的新冠肺炎疫情数据可视化及建模预测.zip基于python的新冠肺炎疫情数据可视化及建模预测.zip基于...
请问JS参数定位方法有哪些 javascript python
2021-11-02 17:13

回答 1 已采纳 https://segmentfault.com/a/1190000
新冠病毒的模拟传播！ c++
2022-01-01 15:04

回答 1 已采纳 #include<iostream> #include<cmath> #include <bits/stdc++.h> using namespace std;
为什么新冠肺炎介绍那个盒子没有往上移动啊 css3
2023-02-09 19:53

回答 2 已采纳 margin-bottom是外边距，距底部600px。你要往上移动，需要让class2跟class3变成同一行，代码为display: inline-block或者用浮动float:left或者用fl
Python爬取全国新冠疫情数据
2022-11-27 17:27

黄小耶@的博客近几年来，我国一直受着疫情的侵扰，随着每天新闻日夜的更迭，我们该如何从新闻中挖掘到有效信息呢？所以大体有2部分，第一是进行数据采集，第二是进行数据分析和数据...本篇讲述的是如何对新闻的新冠疫情数据进行采集
Matlab怎么做非线性拟合 matlab 数据分析
2023-03-18 20:04

回答 4 已采纳关于该问题，我找了一篇非常好的博客，你可以看看是否有帮助，链接：matlab 简单函数拟合（全）您还可以看一下苏金明老师的MATLAB数据拟合课程中的使用拟合工具进行数据拟合-曲线拟合小节, 巩固
基于python的新冠疫情数据分析.zip
2020-06-27 22:47

利用了requests包爬取腾讯实时疫情数据，并对疫情数据做了清洗和分析，对数据分析的结果实现了可视化。压缩包内有源代码和报告。
毕业设计基于python的新冠疫情数据分析系统 request+echarts+layui
2022-06-13 21:01

项目为本人的毕业设计数据来源实时采集某平台疫情数据 request实现对某平台疫情数据爬虫线性回归预测分析 flask实现前后端交互 luyui前端页面 echarts实现新冠疫情数据分析项目不易多多支持！
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月11日

悬赏问题

¥15 r语言蛋白组学相关问题
¥15 Python时间序列如何拟合疏系数模型
¥15 求学软件的前人们指明方向🥺
¥50 如何增强飞上天的树莓派的热点信号强度，以使得笔记本可以在地面实现远程桌面连接
¥20 双层网络上信息-疾病传播
¥50 paddlepaddle pinn
¥20 idea运行测试代码报错问题
¥15 网络监控：网络故障告警通知
¥15 django项目运行报编码错误
¥15 STM32驱动继电器

python爬取北京市新冠数据，结果显示'NoneType' object has no attribute 'find'

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新