学习一个爬虫知识遇到TypeError: object of type 'NoneType' has no len()问题，求明白人指点迷津

本来程序没有什么问题，在添加了如下代码时，程序开始报错

soup = BeautifulSoup(html,"html.parser")
        for item in soup.find_all('div',class_="item"):   #查找符合要求的字符串，形成列表
            data = []
            item = str(item)


            link = re.findall(findLink,item)[0]    #re库通过正则表达式查找指定的字符串
            print(link)
            #print(item)

出现如下问题：

Traceback (most recent call last):
  File "F:\pythonProject\test2\t2.py", line 79, in <module>
    main()
  File "F:\pythonProject\test2\t2.py", line 23, in main
    datalist = getData(baseurl)
  File "F:\pythonProject\test2\t2.py", line 40, in getData
    soup = BeautifulSoup(html,"html.parser")
  File "E:\pythonProject\lib\site-packages\bs4\__init__.py", line 312, in __init__
    elif len(markup) <= 256 and (
TypeError: object of type 'NoneType' has no len()

代码如下，可能有点乱

from test1 import t1
#引入自定义的模块
print(t1.add(3,4))

import urllib.request
import re
import bs4
from bs4 import BeautifulSoup
import sys
import  urllib
import xlwt
import sqlite3


def main():
    baseurl = "https://movie.douban.com/top250?start=0"
    #1.爬取网页
    datalist = getData(baseurl)
    savepath = ".\\doubanTop250.xls"
    #2.解析数据
    #3.保存数据
    #saveData(savepath)

    #askURL("https://movie.douban.com/top250?start=")

findLink = re.compile(r'<a href="(.*?)">')

#1.爬取网页
def getData(baseurl):
    datalist = []
    for i in range(0,1):   #调用获取页面信息的函数*10次
        url = baseurl + str(i*25)
        html = askURL(url)   #保存返回值
        # 2.解析数据
        soup = BeautifulSoup(html,"html.parser")
        for item in soup.find_all('div',class_="item"):   #查找符合要求的字符串，形成列表
            data = []
            item = str(item)


            link = re.findall(findLink,item)[0]    #re库通过正则表达式查找指定的字符串
            print(link)
            #print(item)


    return datalist


#得到指定一个URL的网页内容
def askURL(url):
    head = {   #模拟浏览器头部信息，向豆瓣发送消息
        "User-Agent": "Mozilla / 5.0(Windows NT 10.0;Win64; x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 97.0.4692.71 Safari / 537.36Edg / 97.0.107255"
    }
    #用户代理表示告诉豆瓣服务器我们是什么类型的机器，浏览器（本质上是告诉浏览器，我们可以接受什么内容的文件内容）
    request = urllib.request.Request(url,headers = head)
    html = ""
    try:
        response = urllib.request.urlopen(request)
        html = response.read().decode("utf-8")
        print(html)
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

        return html

#3.保存数据
def saveData(savepath):
    print("save...")

if __name__ == "__main__":
    main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

CSDN专家-showbo 2022-01-11 22:34

关注

askURL的return html缩进有问题，放到except外

def askURL(url):
    head = {   #模拟浏览器头部信息，向豆瓣发送消息
        "User-Agent": "Mozilla / 5.0(Windows NT 10.0;Win64; x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 97.0.4692.71 Safari / 537.36Edg / 97.0.107255"
    }
    #用户代理表示告诉豆瓣服务器我们是什么类型的机器，浏览器（本质上是告诉浏览器，我们可以接受什么内容的文件内容）
    request = urllib.request.Request(url,headers = head)
    html = ""
    try:
        response = urllib.request.urlopen(request)
        html = response.read().decode("utf-8")
        #print(html)
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)
 
    return html

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

学习一个爬虫知识遇到TypeError: object of type 'NoneType' has no len()问题，求明白人指点迷津 python 开发语言有问必答爬虫
2022-01-11 22:04

回答 1 已采纳 askURL的return html缩进有问题，放到except外 def askURL(url): head = { #模拟浏览器头部信息，向豆瓣发送消息 "User-
TypeError: object of type 'module' has no len() pycharm python 深度学习
2022-09-20 20:44

回答 1 已采纳 self.data_source 是一个 module 对象，len()方法接收的参数不能是module，可以是一个列表，字符串等可迭代的对象
python 报错：TypeError: object of type 'MiddleDataset' has no len() python pytorch
2022-04-21 19:26

回答 1 已采纳你调用了len(MiddleDataset)吧，这个是没有len()方法的，你应该找找参数里面哪个是str类型的，用len()包住，而不是MiddleDataset整体
python 报错TypeError: object of type ‘NoneType‘ has no len()处理
2023-08-11 20:10

念广隶的博客当对象为NoneType时，使用len()函数会引发TypeError异常。为了避免这种异常，我们可以使用if语句、三元表达式或try-except语句来判断对象是否为None，并采取相应的处理方法。在编写代码时，要注意处理可能出现None值...
图像转动角度识别到一半出现报错TypeError: object of type 'float' has no len() opencv python 图像处理
2022-04-04 11:17

回答 1 已采纳 if type(numinrange[maxnum])<>'float': for i in range(1, len(numinrange[maxnum])):
python纸牌类TypeError: object of type 'FrenchDeck' has no len() python
2019-06-24 16:46

回答 2 已采纳不知道是你贴出来的问题，还是怎么问题，你这应该是缩进不对呀 __len__方法给类FrenchDeck增加了直接len的操作，但是你这缩进错了 ```python import coll
TypeError: argument of type 'NoneType' is not iterable python
2022-08-05 15:40

回答 2 已采纳 var_keep_dic为空，检查一下var_keep_dic的值，这个变量你是赋值的啥？
Python爬虫 - TypeError: object of type NoneType has no len() 解决方法
2021-02-02 21:09

萌哒哒的CXY的博客关于解决 python爬虫
python 的 object of type 'float' has no len()？ python
2018-08-21 09:36

回答 3 已采纳错误原因：在你的for循环里，df对象被覆盖了，所以第二次循环时，df为空，导致出错。解决办法： 1.使用新的变量 2.使用df的groupby方法 ``` #修改 d
TypeError: 'NoneType' object is not subscriptable这个错误如何解决呀 python 神经网络计算机视觉
2022-04-18 11:51

回答 1 已采纳你把11行的image打印出来看看，这里有问题
SyntaxError: 'NoneType' object is not subscriptable这种报错要怎么处理呀！求指导！ python 开发语言深度学习
2022-09-27 21:41

回答 2 已采纳 lines对象是NoneType，即经过霍夫变换提取出来的线是空的，那么可能前面边缘检测开始或者从图像上就有问题，可以每一行加一下打印，如果lines = cv2.HoughLinesP(edges,
TypeError: object of type 'NoneType' has no len()
2023-01-18 09:56

向沙托夫问好的博客这是一个 Python 程序运行时抛出的错误。它表示程序试图获取长度(len())的对象是 None 类型的对象。 None 类型表示空值，它并没有长度。可能是因为程序中没有正确地初始化或者赋值给了一个变量。 ...
爬虫时出现部分结果报错'NoneType' object is not subscriptable，如何解决？ python 有问必答爬虫
2022-04-25 00:43

回答 2 已采纳 'NoneType' object is not subscriptable这个错误是comment.find("span",{"class":"rating"})没有获取到元素,返回了None 你p
TypeError: object of type ‘NoneType‘ has no len()
2021-12-07 16:11

滚雪球~的博客 TypeError: object of type ‘NoneType’ has no len() 参考：https://blog.csdn.net/xumesang/article/details/51221706 实际上是因为我这个变量并不是list，而且None，即没有初始值类型，len函数不能统计，这时，...
已解决TypeError: object of type ‘int‘ has no len()
2023-04-29 23:30

桃花键神的博客这个错误通常表示你在尝试获取一个整数的长度，但是整数类型并不支持 len() 函数。len() 函数用于获取对象的长度或大小，而整数是一个不可迭代的对象，因此不能使用 len() 函数。
TypeError: object of type ‘module‘ has no len()
2022-09-20 18:25

躺不平的废柴的博客已解决TypeError: object of type 'module' has no len()
解决TypeError: object of type ‘int‘ has no len()
2023-05-11 09:23

OZ__96的博客原因是整数类型的对象没有长度属性。len()函数只能用于有长度属性的对象，例如字符串、列表、元组等。将整数类型的对象转换为...这里是因为在尝试对一个整数类型的对象使用len()函数而出现的错误。修改后程序成功运行。
TypeError: object of type ‘NoneType‘ has no len()的解决方法
2022-12-08 23:51

胡糊啊的博客 TypeError: object of type 'NoneType' has no len()的解决方法
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月11日

悬赏问题

¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码

学习一个爬虫知识遇到TypeError: object of type 'NoneType' has no len()问题，求明白人指点迷津

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新