读取csv文件行数不一致问题

现在我遇到一个情况，就是在读取csv文件时，每个文件都是有1000行数据，但是读取后就是都会少一行数据，只有999个。想知道问一下各位，是代码出现了问题还是其他问题？下面是部分代码和运行后的结果。


# 读取每个CSV文件并提取特征和标签
for file in files:
    try:
        # 使用csv模块读取文件
        with open(file, 'r', encoding='utf-8') as f:
            reader = csv.reader(f)
            rows = list(reader)
            print(f"文件 {file} 的行数: {len(rows)}")
            print(f"文件 {file} 的最后一行: {rows[-1]}")
        
        # 使用pandas读取文件
        data = pd.read_csv(file, encoding='utf-8', on_bad_lines='warn')
        print(f"文件 {file} 的数据形状: {data.shape}")  # 检查数据形状
        features = data.iloc[:, :-1].values  # 获取所有行的前n-1列作为特征
        labels = data.iloc[:, -1].values  # 获取所有行的最后一列作为标签
        x.extend(features)  # 添加特征到x列表
        y.extend(labels)  # 添加标签到y列表
    except Exception as e:
        print(f"读取文件 {file} 时出错: {e}")
print("数据读取完成。")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
陳月亮️ 2025-01-15 13:38
关注
已经解决了，谢谢大家！
因为使用pd.read_csv(file) 默认会自动处理CSV文件中的标题行（即第一行），但是在我经过预处理的数据文件中并没有设置标题行，所以它会把第一行默认为标题行去除了，就剩下999个数据行。
解决办法也简单，就是在预处理数据时候在文件第一行添加标题行就行了，其他代码也不需要修改了。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

php读取csv文件并输出的方法
2020-10-24 13:48

下面是一个使用`fgetcsv()`函数读取CSV文件并输出的示例代码，这段代码与提供的部分内容相符： ```php $row = 0; $j = 1; // 行数，这里用于记录读取到哪一行 $file = "name.txt"; // 要读取的CSV文件名 if (($...
MFC 读取csv文件
2019-01-30 10:50

在MFC中读取CSV（逗号分隔值）文件是常见的任务，特别是在处理数据导入、导出或数据分析时。CSV文件因其简洁的格式和广泛的兼容性而广泛使用。下面我们将详细介绍如何使用MFC来读取CSV文件。首先，理解CSV文件的...
读取CSV文件部分数据并保存—保证可用
2019-01-08 22:49

- `pandas.read_csv()`：这是`pandas`库中的一个函数，用于读取CSV文件并将其转换为DataFrame对象，DataFrame是`pandas`中处理二维表格数据的数据结构。 - 参数：可以设置多个参数，如`filepath_or_buffer`指定...
pandas读取csv文件提示不存在的解决方法及原因分析
2020-12-20 13:17

总的来说，解决Pandas读取CSV文件时的“文件不存在”问题，关键在于确认文件路径的正确性，处理好路径中的编码问题，并根据需要利用`read_csv()`的参数进行调整。了解这些基础知识对于处理实际数据时的效率提升至关...
Python计算csv文件行数
2023-07-11 16:46

未名编程的博客【代码】Python计算csv文件行数。
读取csv文件中指定行列的数据
2018-04-16 10:50

记得在运行前检查CSV文件的编码格式，确保与Java程序的编码设置一致，以防止乱码问题。通过这种方式，你可以有效地读取CSV文件中的指定行和列数据，实现灵活的数据处理。这在数据分析、报告生成、数据导入导出等...
CSV表格拆分,可以把一个CSV文件按固定行数拆分成多个文件
2020-12-21 09:50

2. **读取CSV文件**：`df = pd.read_csv('input.csv')` 3. **设置拆分条件**：如每1000行一个文件。 4. **循环拆分**：遍历数据框，每达到拆分条件，就写入新文件。 5. **写入CSV文件**：`df.to_csv('output_part{}....
c++读取csv文件
2017-12-01 17:33

在C++编程中，读取CSV（逗号分隔值）文件是一项常见的任务，尤其是在数据处理、数据分析或软件工程的上下文中。CSV文件以其简洁、通用的格式被广泛用于存储表格数据，例如数据库导出、电子表格或者统计报告。本文档...
Python读取CSV文件方法[项目代码]
2025-11-12 16:52

首先，提到读取CSV文件，pandas库是不可忽视的工具。pandas是Python的一个数据分析库，提供了大量的数据处理功能，read_csv()是其中的一个重要函数。read_csv()函数可以将CSV文件读取为pandas库中的DataFrame格式，...
c语言读取CSV文件指定行内容
2024-08-07 13:13

良辰与日月的博客 C语言读取csv文件
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月14日

读取csv文件行数不一致问题

5条回答 默认 最新

问题事件

5条回答默认最新