【Python自定义函数】原代码运行，代码放入自定义函数中报错

代码放入自定义函数中报错：
原代码，目的是去除万恶'\u202a'

csvfilename = r'D:\R\R\data\taobao_data.csv'
csvfilename = csvfilename.strip('\u202a')#除去不可见字符
dta = pd.read_csv(csvfilename, encoding = 'gbk') #encoding不可去除

不想每次等报错后再来运行这三行代码，于是写下:

def easyread(a):
    import pandas as pd #导入pandas
    if '\u202a' in a: #检查有无万恶字符
        a = a.strip('\u202a')
        data = pd.read_csv(a, encoding = 'gbk')
        return data
    else:
        data= pd.read_csv(a)
        return data
data1=easyread(r'D:\R\R\data\taobao_data.csv')

报错：
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 354: invalid start byte

为什么原代码运行后没有问题，加入自定义函数就出现了编码问题呢？如何改进我的代码？

按回答更新后，仍然报同样的错：

def easyread(a):
    import pandas as pd
    if '\u202a' in a:
        a = a.strip('\u202a')
        try:
             data = pd.read_csv(a,encoding = 'gbk')
        except UnicodeDecodeError:
            data = pd.read_csv(a,encoding = 'utf-8')
        except UnicodeDecodeError:
            data = pd.read_csv(a,encoding = 'gb18030')
        except UnicodeDecodeError:
            data = pd.read_csv(a,encoding = 'ansi')
        return data
    else:
        data= pd.read_csv(a)
        return data
data1=easyread('D:\\R\\R\\data\\taobao_data.csv')

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间新星创作者: 前端开发技术领域 2024-04-30 22:34
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
问题分析：在原代码中，csvfilename为字符串类型。使用strip函数去除字符串中的不可见字符\u202a。在自定义函数中，参数a同样为字符串类型。使用strip函数去除字符串中的不可见字符\u202a。但在读取csv文件时，使用的编码不同，原代码使用gbk编码，而自定义函数中使用utf8编码。因此，在读取含有中文字符的csv文件时，使用不同的编码会导致编码错误。改进方法：在自定义函数中，可以增加一个参数encoding用于指定编码格式。修改后的代码：
import pandas as pd def easyread(a, encoding='utf8'): if '\u202a' in a: a = a.strip('\u202a') data = pd.read_csv(a, encoding=encoding) return data else: data = pd.read_csv(a) return data data1 = easyread(r'D:\R\R\data\taobao_data.csv', encoding='gbk')

在调用自定义函数时，可以指定csv文件的编码格式。这样就可以避免编码错误。参考资料： pandas.read_csv
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python自定义函数lambda_自定义函数
2021-02-04 12:01

淇水煮汤的博客 1.1 使用函数在Python中，函数必须先声明，然后才能调用它，使用函数时，只要按照函数定义的形式，向函数传递必需的参数，就可以调用函数完成相应的功能或者获得函数返回的处理结果。如果函数有返回值，那么需要在...
【Python深入浅出⑯】解锁Python3自定义函数：从新手到高手的进阶之路
2025-02-04 15:56

奔跑吧邓邓子的博客在 Python3 的编程世界里，函数是一种极为重要的概念。简单来说，函数就是组织好的、可重复使用的代码段，专门用于实现单一或相关联的功能。打个比方，你可以把函数想象成一个 “功能盒子”，只要往里面输入特定的...
python123自定义幂函数_python基础之函数
2020-12-10 09:38

weixin_39908985的博客但你也可以自己创建函数，这被叫做用户自定义函数。定义一个函数在Python中，定义一个函数要使用def语句，依次写出函数名、括号、括号中的参数和冒号:，然后，在缩进块中编写函数体，函数的返回值用return语句...
【Python深入浅出⑰】Python3内置函数：编程世界的百宝箱
2025-02-04 16:34

奔跑吧邓邓子的博客 Python 3 的内置函数是其语言生态中极为重要的组成部分，它们覆盖了从基本数据类型转换、数学运算、序列操作到字符串处理等多个领域，为开发者提供了简洁高效的编程工具。通过这些内置函数，开发者能够以较少的代码...
Python函数模块自定义封装及模块嵌套导入（手把手教程）
2023-02-12 13:25

JerryC_py白菜的博客编程时存在同一函数多次调用，子函数在父函数中多次使用的情况，同时为了便于开发者之间的程序互通与调用，python提供了自定义模块的封装与嵌套调用功能。
python定义一个求和函数_Python玩数据入门必备系列：自定义函数与无限参数
2020-11-23 22:31

weixin_39710361的博客此系列文章收录在公众号(建议按顺序阅读本系列文章) ：数据大宇宙 > Python入门必备 > 必备知识转发本文并私信我"python"，即可获得Python资料以及更多系列文章(持续更新的)最近有许多小伙伴问我要入门 Python 的...
python定义函数
2023-07-16 19:42

爆笑蛙的博客本文详细介绍了python中函数的定义以及无参函数、有参函数、传参方式、缺省参数、可变参数*args、关键参数**kwargs、return语句、函数注释、递归函数、回调函数、闭包函数、多态函数的使用方式。
四、Python作用域、函数及编程范式
2025-01-09 20:49

weixin_45460686的博客 Python作用域、函数及编程范式
python编写函数add求和_Python进阶之函数式编程
2020-11-29 04:30

weixin_39643865的博客函数式编程函数是Python内建支持的一种封装，我们通过把大段代码拆成函数，通过一层一层的函数调用，就可以把复杂任务分解成简单的任务，这种分解可以称之为面向过程的程序设计。函数就是面向过程的程序设计的基本...
python函数详解（超详细）
2023-06-15 06:30

奇妙的大歪的博客首先零基础是能学python的，很多编程大神入门之前都选择先学习Python，所以想学就大胆去学吧，没学之前谁不是零基础，就算是现在才下定决心学也不怕，学习Python什么时候都不算晚。零基础如何学好python，作为一个学...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月30日

【Python自定义函数】原代码运行，代码放入自定义函数中报错

5条回答 默认 最新

问题事件

5条回答默认最新