python实现对文本数据的错误数据删除

1.以下数据格式第一列为时间，时间相同情况下，第二列数据需要递增，否则是错误的需要删除这一行数据
2.文本数据贴一部分：
16:28:34 3965 22 2 9
16:28:34 4165 22 1 8
16:28:34 4365 22 1 6
16:28:34 4568 22 2 9
16:28:34 4766 21 0 9
16:28:34 497 22 1 9
16:28:34 5166 22 1 9
16:28:34 5365 22 1 8
16:28:34 5565 23 0 9
16:28:34 5778 22 1 8
16:28:34 5965 22 2 9
16:28:34 6169 21 2 9
16:28:34 6365 21 1 9
16:28:34 657 21 1 9
16:28:34 6765 22 1 8
16:28:34 6966 22 2 9
16:28:34 7166 22 1 8
16:28:34 7365 22 1 9
3.我用列表方式读了这个数据，n行m列的列表
F1 = open(r"C:\Users\11816\Desktop\data_clear.txt", "r")
List_row = F1.readlines()
list_source = []
#x = len(List_row)-1;
#y = len(List_row[0].split("\t"))-1;
for i in range(len(List_row)):
column_list = List_row[i].strip().split("\t") # 每一行split后是一个列表
list_source.append(column_list) # 加入list_source
print(list_source)#二元组

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
狂颜 2019-04-18 16:39
关注
算法流程：逐行读取文本，符合要求打印，否则不打印，这样即可完成数据的过滤。
第一列时间的比较，如果格式符合 hh:mm:ss 的话直接用字符串比较即可。
代码如下：

# encoding=utf8 path = "1.txt" f = open(path) last_date = "" last_num = 0 for line in f: line = line.rstrip() item = line.split(" ") date = item[0] num = float(item[1]) if date > last_date: # 直接比较即可，字符串比较原理 last_date = date print(line) elif date == last_date: if num > last_num: last_num = num print(line)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python读取CSV数据及处理空值重复后保存
2025-07-02 09:52

在Python中，可以继续使用`csv.writer`或者`pandas.to_csv`函数来实现数据的保存。保存过程中，可以设定是否需要包含表头，是否需要转换为特定的编码格式等，以满足不同的需求。总结起来，处理CSV文件中的空值和...
[python练习实例源码]多图表实现员工满意度调查数据分析.zip
2023-08-27 02:34

熟悉Python的基本语法是实现数据分析的前提。 2. **数据分析库Pandas**：Python中的Pandas库是数据处理的核心工具，它提供了高效的数据结构DataFrame，方便读取、清洗、转换和分析数据。在这个实例中，可能需要使用...
用Python分析文本数据的词频并词云图可视化
2023-09-20 09:48

艾派森的博客上次批量提取了上市公司主要业务信息，要分析这些文本数据，就需要做文本词频分析。由于中文不同于英文，词是由一个一个汉字组成的，而英文的词与词之间本身就有空格，所以中文的分词需要单独的库才能够实现，常用的...
[Python从零到壹] 十五.文本挖掘之数据预处理、Jieba工具和文本聚类万字详解
2021-08-06 23:40

Eastmount的博客本文将详细讲解数据预处理、Jieba分词和文本聚类知识，这篇文章可以说是文本挖掘和自然语言处理的入门文章。两万字基础文章，希望对您有所帮助。欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列...
基于Python热门旅游景点数据分析系统设计与实现
2023-06-28 09:12

java李杨勇的博客 Python是由荷兰数学和计算机研究学会的吉多•范罗苏姆于20世纪90年代设计的一款高级语言。Python优雅的语法和动态类型，以及解释型语言的本质，使它成为许多领域脚本编写和快速开发应用的首选语言。Python相比与其他...
Python源码11如何去除文本信息中的干扰数据.zip
2025-01-23 12:52

需要注意的是，在进行文本处理之前，对文本数据进行备份是一个良好的习惯，以防在处理过程中出现数据丢失或损坏。去除文本信息中的干扰数据是文本处理中的一项重要工作，掌握正确的处理方法和工具能够大大提升数据...
Python数据可视化分析大作业-全国高校数据分析与可视化（源码 + 文档）.zip
2024-09-03 15:23

在本项目中，"Python数据可视化分析大作业-全国高校数据分析与可视化" 是一个全面的实践教程，旨在通过Python编程语言来探索和呈现全国高校的数据。这个项目涵盖了数据科学的关键步骤，从数据预处理到最终的可视化...
python 实现批量替换文本中的某部分内容
2020-09-18 07:25

使用Python编程语言可以高效地完成这一任务，本文将分享如何利用Python来批量替换文本文件中的某部分内容，并提供实际的代码实现示例。首先，需要导入Python的两个常用模块：`re`（正则表达式）和`os`（操作系统...
python数据分析——数据预处理
2024-06-21 13:19

鲜于言悠905的博客在Python数据分析中，数据预处理通常包括数据清洗、数据转换和数据特征工程等步骤。数据清洗是数据预处理的第一步，主要是为了解决数据中的缺失值、异常值、重复值等问题。Python提供了丰富的库和工具来处理这些问题...
python 数据转换 python资源
2025-08-16 21:16

数据丢失或转换错误都会对分析结果造成影响。因此，进行数据转换时，检查数据的有效性、处理异常值、填补缺失值等步骤也是不可或缺的。Python中也有相应的工具和技术来帮助完成这些工作，如Pandas提供的fillna()函数...
没有解决我的问题, 去提问

python实现对文本数据的错误数据删除

1条回答 默认 最新

1条回答默认最新