爬虫报错TypeError: stat: path should be string, bytes, os.PathLike or integer, not function，如何解决？

问题遇到的现象和发生背景

用PyCharm爬取https://www.dieniao.com的免费代理IP时，出现错误TypeError: stat: path should be string, bytes, os.PathLike or integer, not function。用的环境是Anaconda

问题相关代码，请勿粘贴截图

#免费获取代理IP
import requests
import urllib3
from lxml import etree
import pandas as pd
from sqlalchemy import false

ip_list = []                                                #创建保存IP地址的列表
urllib3.disable_warnings()

def get_ip(url,headers):
    #发送网络请求
    response = requests.get(url,headers=headers,verify = false)
    response.encoding = 'utf-8'                             #设置编码方式
    if response.status_code == 200:                         #判断请求是否成功
        html = etree.HTML(response.text)                    #解析HTML
        #获取所有带有IP的li标签
        li_all = html.xpath('//li[@class="f-list col-lg-12 col-md-12 col-sm-12 col-xs-12"]')
        for i in li_all:                                            #遍历每行内容
            ip = i.xpath('span[@class="f-address"]/text()')[0]  #获取IP
            port = i.xpath('span[@class="f-port"]/text()')[0]   #获取端口
            ip_list.append(ip+':'+port)                         #将IP与端口组合并添加至列表当中
            print('代理ip为：', ip, '对应端口为：', port)
#头部信息
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'}
if __name__ == '__main__':
    ip_table = pd.DataFrame(columns=['ip'])                     #创建临时表格数据
    for i in range(1,5):
        #获取免费代理IP的请求地址
        url = 'https://www.dieniao.com/FreeProxy/{page}.html'.format(page=i)
        get_ip(url,headers)
    ip_table['ip'] = ip_list                        #将提取的IP保存至Excel文件的IP列
    #生成xlsx文件
    ip_table.to_excel('ip.xlsx', sheet_name='data')

想让程序正常运行，爬取到IP

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-HGJ 2022-01-26 21:38

关注

由于参数verify的值写错了，应该为verify=Faslse。在调用adapter模块时以为读取是证书文件，调用时报错。代码修改成如下即可：

import requests
import urllib3
from lxml import etree
import pandas as pd
from sqlalchemy import false

ip_list = []  # 创建保存IP地址的列表
urllib3.disable_warnings()


def get_ip(url, headers):
    #发送网络请求
    response = requests.get(url, headers=headers, verify=False)
    response.encoding = 'utf-8'  # 设置编码方式
    if response.status_code == 200:  # 判断请求是否成功
        html = etree.HTML(response.text)  # 解析HTML
        #获取所有带有IP的li标签
        li_all = html.xpath(
            '//li[@class="f-list col-lg-12 col-md-12 col-sm-12 col-xs-12"]')
        for i in li_all:  # 遍历每行内容
            ip = i.xpath('span[@class="f-address"]/text()')[0]  # 获取IP
            port = i.xpath('span[@class="f-port"]/text()')[0]  # 获取端口
            ip_list.append(ip+':'+port)  # 将IP与端口组合并添加至列表当中
            print('代理ip为：', ip, '对应端口为：', port)
    return ip_list

#头部信息
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36'}
if __name__ == '__main__':
    ip_table = pd.DataFrame(columns=['ip'])  # 创建临时表格数据
    iplst=[]
    for i in range(1, 5):
        #获取免费代理IP的请求地址
        url = 'https://www.dieniao.com/FreeProxy/{page}.html'.format(page=i)
        ip_list=get_ip(url, headers)
        iplst+=ip_list
    ip_table['ip'] = iplst  # 将提取的IP保存至Excel文件的IP列
    #生成xlsx文件
    ip_table.to_excel('ip.xlsx', sheet_name='data')

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

爬虫报错TypeError: stat: path should be string, bytes, os.PathLike or integer, not function，如何解决？ pycharm python 有问必答爬虫
2022-01-26 20:48

回答 2 已采纳由于参数verify的值写错了，应该为verify=Faslse。在调用adapter模块时以为读取是证书文件，调用时报错。代码修改成如下即可： import requests import urll
出现这样的错误：TypeError: expected str, bytes or os.PathLike object, not list，怎么处理？ list pycharm python
2022-07-08 20:35

回答 2 已采纳你不把你利用的程序贴出来，谁知道哪里错了。。。
TypeError: expected str, bytes or os.PathLike object, not TextIOWrapper python 开发语言
2022-07-07 11:14

回答 1 已采纳 open()和with open() 语句都是打开文件。需要的参数都是文件路径你应该将 path = 'C:\Users\Administrator\Desktop\实训\data\anhui.txt
解决报错TypeError: stat: path should be string, bytes, os.PathLike or integer, not NoneType
2023-07-26 15:27

Dreaming_of_you的博客 from transformers import BertTokenizer tokenizer = BertTokenizer.from_pretrained("bert-...sequence) 报错位置： tokenizer = BertTokenizer.from_pretrained('bert-base-cased') 解决办法：将双引号改为单引号。
Python报错TypeError: float() argument must be a string or a number, not 'NoneType' python 有问必答
2021-12-05 15:08

回答 1 已采纳 Excel里面取到的值，包含了null值，转换为float类型报错。
Python3.85报错：TypeError: int() argument must be a string, a bytes-like object or a number, not 'list' python
2023-01-16 21:17

回答 2 已采纳望采纳！！！把这段代码theListName = int(list(theVariableName))修改成下面这样的： theListName = int("".join(list(theVari
vue搭建路由报错 TypeError: Object(...) is not a function vue.js
2022-02-09 13:47

回答 3 已采纳 vue-router版本过高，将vue-router版本降低就不会报错了 vue搭建路由报错 TypeError: Object(...) is not a functi
TypeError: _isdir: path should be string, bytes or os.PathLike, not bool
2020-05-01 23:22

千码君2016的博客 import os def search_by_date(path): if os.path.isdir(path): dirs = os.listdir(path) for i in dirs: print(os.path.join(path, i)) if os.path.isdir(os.path....
python报错TypeError: expected string or bytes-like object如何解决如何修改 python
2023-02-21 12:05

回答 2 已采纳已会
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NoneType' python 有问必答
2021-07-23 10:21

回答 2 已采纳应该跟你使用的tensorflow版本有关，之前我遇到过tensorflow2.x和1.x代码有很多不一样的
python报错TypeError: Dimension value must be integer or None or have an __index__ method, got 3.0 python 深度学习
2023-04-23 23:43

回答 3 已采纳 1.原因：这个错误通常发生在使用tensorflow或keras的时候，当定义一个层或一个张量的维度时，传入了一个浮点数而不是一个整数或者None。例如，如果使用tf.keras.Input (sha
TypeError: _getfullpathname path should be string bytes or os.pathlike not tuple
2020-08-25 11:48

Sun-China的博客 MEDIA_ROOT = os.path.join(BASE_DIR, 'media'), # This is a tuple STATIC_ROOT = os.path.join(BASE_DIR, 'static'), # So is this 解决方案：删除结尾的逗号，就能解决。 MEDIA_ROOT = os.path.join(BASE_DIR
labelImg报错 TypeError: expected str, bytes or os.PathLike object, not NoneType闪退、无法更改文件路径
2023-03-13 17:11

交大鹏于晏的博客 labelImg更改路径闪退，报错TypeError: expected str, bytes or os.PathLike object, not NoneType
python报错TypeError: expected str, bytes or os.PathLike object, not NoneType
2019-04-28 20:47

Jayden yang的博客出现这种错误的原因主要发生在打开文件时，文件路径... path = os.fspath(path) 定位到我的代码中问题代码是：有查了一些资料，有博主说路径没有添加到变量中，尝试以后没能解决我的问题，分析原因主要是因为，...
Django上传图片时出现HTTP报错TypeError: expected str, bytes or os.PathLike object, not tuple
2021-11-09 00:04

GallopZhang的博客一、报错描述最近在做一个Django博客的功能，通过admin界面上传图片，浏览器提示上传文件时一直发生HTTP错误（错误代码：500），这个问题困扰了我很久，修改settings.py和urls.py都没有...
conda创建虚拟环境，pip list报错TypeError: expected str, bytes or os.PathLike object, not int
2021-12-17 20:53

倔强的小菇凉的博客原因：pip 9.0.1版本太旧，直接升级仍然报错解决方法：执行curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py 在进行升级安装：python get-pip.py --force-reinstall 问题解决
Python运行错误TypeError: expected str, bytes or os.PathLike object, not list的解决方法
2021-07-14 09:51

xiaoxiaoqin@的博客 words with open(filename,'r') as f_obj: TypeError: expected str, bytes or os.PathLike object, not list 重点就在最后一句： TypeError: expected str, bytes or os.PathLike object, not list 问题解决： 1....
解决TypeError: expected str, bytes or os.PathLike object, not NoneType
2020-12-15 16:51

CV_William的博客解决TypeError: expected str, bytes or os.PathLike object, not NoneType 报错信息 TypeError: expected str, bytes or os.PathLike object, not NoneType 解决办法 pip install numpy==1.19.0 欢迎大家交流...
TypeError: expected str, bytes or os.PathLike object, not int（解决方法）
2021-06-21 16:56

宗而研之的博客在使用 pip 安装软件时，报错如下 $ pip install numpy Exception: Traceback (most recent call last): File "/usr/lib/python3/dist-packages/pip/basecommand.py", line 215, in main status = self.run...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月26日

悬赏问题

¥15 latex投稿显示click download
¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？