关于python中处理带逗号的CSV文件

现在要处理大量的TXT文件数据，txt文件中数据是用逗号分隔的，但有部分数据是本身已经含有逗号。这样就导致了我用spilt()函数分隔时造成分隔出错。请问下有python经验或者用python处理大量CSV TXT 或者excel经验的老大怎么解决这个问题。

我自己的想法是：
1，可不可在处理文件前直接把txt文件全部重命名成为CSV，然后用CSV模块出处理，这样行不行。

除了这个还有没有更加可行的方法。

另外再请问一个问题用py来处理这种数据量大的表格怎么实现类始于Vlookup这种功能来筛选需要的数据的方法。简单说明下就好

、

谢谢，小白一个现在自学py 多谢各位老大了

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
huanyeliu 2019-05-05 23:09
关注
一个可行的办法是，在本身含有逗号的数据段两端加上引号后写入文件名结尾是.csv的文件，再用CSV模块读入这个文件导入到python自己的数据结构比如list或dictionary。
但这个方法的前提是能够找出本身含有逗号的数据段与其他数据段所不同的特征，这样才可以利用数据段的特征在数据段两端加上引号，比如可以用python string的index，find方法或结合regular expression 模块来处理字符串。所以你最好能贴出一个txt文件的前几行，来看一下本身含有逗号的数据段有什么特点区别于其他数据段。

另外你提到的将txt重命名为csv文件，CSV模块仍然会把本身含有逗号的一个数据段当成多个以逗号分隔的数据段，你可以用Excel打开改名后的csv件检验一下，会发现本身含有逗号的一个数据段被分成了若干列。
你提到第二个问题可以用pandas模块来处理表格，用pandas.read_csv方法将csv文件转换成dataframe以后，可以用dataframe的join或pandas 的merge方法配合dataframe 的行索引，列索引来实现类似excel的vlookup功能来筛选数据。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python处理CSV文件[代码]
2025-11-12 16:06

在Python中处理CSV文件，通常有多种库可以使用，其中最著名的便是csv库和pandas库。csv库是Python的标准库之一，它提供了一系列类来读取、写入和操作CSV文件。而pandas是一个功能强大的数据分析和操作库，它提供了一...
python读取csv文件.txt
2024-10-24 09:01

在Python中读取CSV文件通常涉及到几个步骤。首先，需要使用csv模块，它提供了读取和写入CSV文件的功能。通过导入csv模块，可以使用其中的函数和类来操作CSV文件。打开CSV文件时推荐使用with语句，这种方式可以确保...
【Python编程】基于csv模块的CSV文件处理：读写操作与字典应用详解
2025-07-02 13:15

内容概要：本文详细介绍了 Python 中的 csv 模块，用于处理 CSV（逗号分隔值）文件。CSV 文件是常见的表格数据存储格式，Python 的 csv 模块提供了读取、写入以及使用字典方式处理 CSV 文件的功能。文章首先讲解了...
python处理csv文件字段中含有逗号的情况,在Python的字段中使用逗号读取CSV文件
2020-11-30 10:35

FeMnO的博客 I need to read a CSV file which has fields that have a comma, so I have double quoted the fields which contains commas, such as:1, "text1,text2", "text3, text4", a, b, cBut when I try to read the file...
Python文件处理II——CSV文件处理
2024-05-26 23:43

每天都在头秃的博客 Python中处理CSV文件的思路与其他文件大体相同，我们需要提前下载好csv模块，准备好数据集，然后按照打开文件，读取文件，写入文件，关闭文件的思路处理，当然也要记住必要的函数方法。希望本文能对你有所帮助。
Python使用Pandas对csv文件进行数据处理的方法
2020-09-18 22:35

在介绍的具体案例中，作者通过实例代码展示了如何使用Pandas处理一个140多MB的CSV文件，该文件包含超过170万行数据。在初次尝试中，作者尝试了多种方法，包括导入MySQL数据库以及使用R语言处理。然而，这些方法要么...
Python Pandas批量读取csv文件到dataframe的方法
2020-09-20 01:58

在处理数据时，Python中的Pandas库是处理和分析表格数据的强大工具。它尤其擅长处理CSV（Comma-Separated Values）文件，即用逗号分隔的纯文本表格数据。Pandas 提供了多种读取数据的功能，特别是对于批量处理多个...
Python数据处理：深入探索csv模块
2024-11-24 11:39

csv模块是Python编程语言中用于处理CSV（逗号分隔值）文件的强大工具。CSV文件是一种常见的数据交换格式，其优点在于简单易读、跨平台兼容性好，能够被多种软件和编程语言读取。在数据处理领域，尤其是数据分析、...
Python高效处理CSV数据的实用方法
2025-08-06 15:31

CSV（逗号分隔值）文件是一种常见的表格数据存储格式，因此掌握使用 Python 处理 CSV 数据是数据分析师的基础技能。在 Python 中，处理 CSV 文件主要涉及一些常用模块。csv 模块是 Python 标准库的一部分，用于读取...
Python从html文件提取数据并生成csv文件
2025-10-16 10:50

利用Python将提取出的数据写入CSV文件中，可以使得数据的进一步分析和处理变得更加容易。为了实现这一过程，开发者需要掌握Python的基础语法和库的使用方法。在代码中，首先需要导入BeautifulSoup库以及csv模块，...
没有解决我的问题, 去提问

关于python中处理带逗号的CSV文件

2条回答 默认 最新

2条回答默认最新