python 爬虫报错问题

为什么爬虫改网址都就报错，请教一下
源码：

import requests
import random
import time
import socket
import http.client
from bs4 import BeautifulSoup
import sys

def get_content(url , data = None):
    header={
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
        'Accept-Encoding': 'gzip, deflate, sdch',
        'Accept-Language': 'zh-CN,zh;q=0.8',
        'Connection': 'keep-alive',
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.235'
    }
    timeout = random.choice(range(80, 180))
    while True:
        try:
            rep = requests.get(url,headers = header,timeout = timeout)
            rep.encoding = 'utf-8'
            break
        except socket.timeout as e:
            print( '3:', e)
            time.sleep(random.choice(range(8,15)))

        except socket.error as e:
            print( '4:', e)
            time.sleep(random.choice(range(20, 60)))

        except http.client.BadStatusLine as e:
            print( '5:', e)
            time.sleep(random.choice(range(30, 80)))

        except http.client.IncompleteRead as e:
            print( '6:', e)
            time.sleep(random.choice(range(5, 15)))

    return rep.text
    # return html_text

def get_data(html_text):
    final = []
    bs = BeautifulSoup(html_text, "html.parser")  # 创建BeautifulSoup对象
    body = bs.body # 获取body部分
    data = body.find('div', {'id': '7d'})  # 找到id为7d的div
    ul = data.find('ul')  # 获取ul部分                               #报错地方！
    li = ul.find_all('li')  # 获取所有的li

    for day in li: # 对每个li标签中的内容进行遍历
        temp = []
        date = day.find('h1').string  # 找到日期
        temp.append(date)  # 添加到temp中
        inf = day.find_all('p')  # 找到li中的所有p标签
        temp.append(inf[0].string,)  # 第一个p标签中的内容（天气状况）加到temp中
        if inf[1].find('span') is None:
            temperature_highest = None # 天气预报可能没有当天的最高气温（到了傍晚，就是这样），需要加个判断语句,来输出最低气温
        else:
            temperature_highest = inf[1].find('span').string  # 找到最高温
            temperature_highest = temperature_highest.replace('℃', '')  # 到了晚上网站会变，最高温度后面也有个℃
        temperature_lowest = inf[1].find('i').string  # 找到最低温
        temperature_lowest = temperature_lowest.replace('℃', '')  # 最低温度后面有个℃，去掉这个符号
        temp.append(temperature_highest)   # 将最高温添加到temp中
        temp.append(temperature_lowest)   #将最低温添加到temp中
        final.append(temp)   #将temp加到final中

    return final
def write_data(data, name):
    file_name = name
    with open("爬虫.txt",'w') as f:
         f_csv = f
         for i in range(len(data)):
                  for j in range(4):
                           a = str(data[i][j]) + "  "
                           print(f'{a}',end = '')
                           f_csv.write(a)
                  print('\n')
                  f_csv.write('\n')
                  #print("\nyes")

if __name__ == '__main__':
    url ='http://www.weather.com.cn/weather/101190401.shtml'    #这里改成http://www.tradinghours.com/markets
                                                                                                     #就报错
    html = get_content(url)
    result = get_data(html)
    write_data(result, 'weather.csv')
    print("爬虫已完成")

报错信息：

Traceback (most recent call last):
  File "C:/Users/Administrator/Desktop/python/python(窗口)/tkinter/CSDN/答题.py", line 108, in <module>
    result = get_data(html)
  File "C:/Users/Administrator/Desktop/python/python(窗口)/tkinter/CSDN/答题.py", line 71, in get_data
    ul = data.find('ul')  # 获取ul部分
AttributeError: 'NoneType' object has no attribute 'find'

报错地方：ul = data.find('ul') # 获取ul部分

我试了很多次都不行，请教一下，急！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
much0726 2022-06-02 15:44
关注
data = body.find('div', {'id': '7d'}) # 找到id为7d的div
地址修改后，上面的这个data找不到值为空了，后面就报错了。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

5个常见Python爬虫报错及解决方法.pdf
2025-04-20 15:39

它作为当今最热门的编程语言，以简洁优雅的语法和强大的功能，深受全球开发者喜爱。该文档为你开启一段精彩的 Python 学习之旅。从基础语法的细致讲解，到实用项目的实战演练，逐步提升你的编程能力。无论是数据科学...
Python爬虫报错：No module named jsonpath
2020-05-23 10:09

多欢喜 的博客还是在写爬虫代码，我又遇到了新的错误源代码是这样子的好吧，其实这个错误很简单，就是没有安装jsonpath 那我们就安装一下就OK了打开cmd，安装jsonpath pip install jsonpath
Python中网络爬虫报错的调试与修复：全网最有效最简单的解决方案
2025-04-28 08:25

喜欢编程就关注我的博客 Python网络爬虫的报错调试与修复需要开发者具备一定的耐心和技巧。通过了解常见的报错类型及原因，掌握有效的调试与修复方案，并采取优化措施提高爬虫的...希望本文提供的解决方案能对广大Python爬虫开发者有所帮助。
Python常见报错及解决方案，建议收藏！
2024-10-22 15:51

疯狂的超级玛丽的博客如果说写代码最害怕什么，那无疑是Bug。而对于新手来说，刚刚接触编程，在享受写代码的成就感时，往往也会被各式各样的Bug弄得晕头转向。今天，我们就做了一期Python常见报错的分享，拯救你的代码！
Python中爬虫反爬机制报错的排查与修复
2025-05-04 19:20

喜欢编程就关注我的博客 Python爬虫反爬调试需要结合请求伪装行为模拟和数据解析开发阶段使用curl -I命令验证请求头配置通过Fiddler抓包分析动态参数生成逻辑借助PyCharm调试器逐步执行JS逆向代码测试阶段编写单元测试验证代理池可用性使用...
Python爬虫入门
2025-05-14 21:30

咕噜咕噜啦啦的博客爬虫（Web Crawler），也称为网络爬虫或蜘蛛程序，是一种自动。它通过模拟人类浏览网页的行为访问网站的页面，提取页面中的信息，并将其存储到本地或数据库中。爬虫广泛应用于搜索引擎、数据分析、内容推荐等领域
python 爬虫代码
2023-03-09 21:49

qq_繁华的博客 python 爬虫代码
Python运行不报错又无任何结果输出
2024-08-10 18:00

二川bro的博客 Python运行不报错又无任何结果输出
Python爬虫：打开数据世界的魔法钥匙
2025-03-02 22:37

大雨淅淅的博客 Python 拥有丰富的库，这简直是爬虫开发者的宝藏库。比如，当我们需要发送 HTTP 请求获取网页内容时，Requests 库就像一位高效的信使，只需简单的几行代码，就能轻松地与服务器进行通信，获取我们想要的网页数据。...
【扇贝编程】python爬虫——爬取动态网页笔记
2024-09-03 14:52

s_5421的博客别急，小贝马上教会你</a> <a href="https://wpblog.x0y1.com/?p=34" rel="bookmark">Python 环境搭建指南</a> 因为他，Python 成为当下最红编程语言</a> 对于每个 a 元素，我们需要的是其 href 属性中的链接。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 6月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月2日

python 爬虫报错问题

4条回答 默认 最新

问题事件

4条回答默认最新