python处理tsv文件矩阵

现有一个矩阵（tsv文件），行名为ENSG开头+数字编号
前五行五列情况如图

现已知行名中，小数点前数值出现重复，小数点后数值不同，
现需要保留小数点后数值最大的行名，去除其他小数点后数值更小的行名
例如:行名为7700.1 7700.2 7700.5的三行，仅保留7700.5所在行
输出一个行名没有重复的新矩阵，列名不变

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Java大魔王 2022-10-12 11:45
关注
思路：字符串分割后分组，分组后比较排序后筛选剔除

import pandas as pd df = pd.read_csv('xxxx.tsv', sep='\t') df['tempOne'] = df['A'].apply(lambda x: x.split(".")[0]) df['tempTwo'] = df['A'].apply(lambda x: int(x.split(".")[1])) df_new = df.iloc[df.groupby('tempOne').apply(lambda o: o['tempTwo'].idxmax())] df_new.drop(['tempOne', 'tempTwo'], axis=1, inplace=True)

源数据：

结果：
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

在Python中读取R语言数据并使用NMF算法
2025-08-12 13:44

在Python中读取R语言数据并使用非负矩阵分解（NMF）算法，首先需要解决的是如何在Python环境中导入R语言的数据文件。R语言通常保存数据的格式有RData、RDS以及常见的CSV和TSV格式等。Python可以利用一些专门的库如`...
美赛python学习d14--自然语言处理nlp
2022-02-06 11:41

林生时见lu的博客自然语言处理的应用文本的分类，文本的翻译实例根据用户的评价和是否喜欢某商品训练模型，根据新用户的评价判断是否喜欢某商品文本的清理：将所有评论看成一个稀疏矩阵，行数代表评论的个数，列数代表不同单词...
NLP自然语言处理
2024-10-04 11:17

爱敲代码的小崔的博客自然语言处理（ NLP）是计算机科学、人工智能和语言学的一个分支，旨在使计算机能够理解、解释和生成人类的自然语言。
为什么说Python是数据科学领域的最佳语言？
2022-07-23 20:16

一个乖乖码字的程序猪的博客 Python是任何数据科学家的基础，如果你想从事数据科学领域的工作，那么你绝对应该考虑Python作为主要语言，因为它语法简单并且有大量的支撑库。httpshttpshttpshttpshttps。
基于Python与HTML的交互式数据分析demo设计源码
2024-10-01 15:12

本项目是一个基于Python编程语言与HTML网页技术的交互式数据分析demo设计源码。它由多个文件类型组成，其中包括交互式笔记本、数据配置文件、文档、表格数据、项目配置文件、许可协议文件、高通量数据分析文件、矩阵...
Python 掌握这34个库！让复杂工作变成半小时搞定!
2025-05-16 13:51

奔向理想的星辰大海的博客 Python提供了多种自动化库，用于处理不同格式的文件和任务。对于Excel自动化，常用的库包括xlwings、openpyxl、xlrd、xlwt、xlutils、xlsxwriter和pandas，它们支持从读取、写入到复杂的数据分析操作。Word文档处理...
Python编程中常见的异常处理numpy简介
2020-11-30 18:32

程序猿分享的博客今天将对python编程中经常会遇到的一些报错与异常的进行总结与分析，虽然不会面面俱到，但是可以提供一种面对这样的问题时的思考方法，会对python的编程能力的提高有所帮助。初学python经常会遇到的一些错误：下面...
27、自然语言处理应用部署与相关概念解析
2025-09-01 01:46

vim8coder的博客本文深入探讨了自然语言处理（NLP）应用部署前的关键问题，包括网络资源下载、与Spark NLP及TensorFlow的集成等。同时分析了应用的扩展性、性能指标、测试策略以及相关技术概念，如算法复杂度、标注、嵌入、语言模型...
27、自然语言处理应用部署与相关技术要点
2025-09-02 08:15

懒狗帮帮主的博客本文详细探讨了自然语言处理（NLP）应用在部署前需要考虑的关键问题，包括缓存与下载、集成检查、扩展与性能、测试等方面，并对相关的技术概念进行了系统性解释。同时，文章分析了实际应用中的挑战，如数据敏感性、...
R语言稀疏矩阵详解
2022-01-15 11:38

jefferyLLLLL的博客 R语言常用稀疏矩阵解析，包括dgCMatrix、dgTMatrix、dgRMatrix
生信多语言协同实战指南：Python+R+Shell+Perl 复杂分析场景高效联动
2025-12-08 21:16

Sol_HY的博客生信分析的核心是 “解决问题” 而非 “精通单一语言”，Python+R+Shell+Perl 的协同本质是利用各语言的核心优势，构建高效、可复现的分析流程。Shell 作为 “总指挥”，负责流程调度和批量操作；Perl 负责轻量级...
【自然语言处理】Transformer模型原理和PyTorch实现【文本生成】
2023-09-08 00:58

光子AI的博客自然语言生成（Natural Language Generation）是NLP领域的一个重要任务。传统的序列到序列学习方法对大规模语料库的训练效率低下、对长距离关系建模能力不足等诸多问题都显得束手无策。因此，Transformer模型...
整理了 34 个 Python 自动化办公库
2021-08-24 08:01

Sim1480的博客以下文章来源于Python自动化办公社区作者牛稳稳今天继续给大家分享2周时间整理的Python自动化办公库。本次内容涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处...
34个Python 自动化办公库清单
2022-07-11 11:01

Python数据之道的博客来源：牛稳稳本次内容涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处理等所有能在办公场景实现自动化的库，希望能够对大家有所帮助。PythonExcel自动化库// 1.xlwings 库官网：https://www.xlwings.org/特点...
整理了34个Python自动化办公库
2021-08-26 21:37

数据不吹牛的博客来源丨Python自动化办公社区作者丨牛稳稳我是小z今天给大家分享一下，花费2周时间整理的Python自动化办公库。本次内容涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、...
超实用！精选34个Python自动化库！
2023-03-05 11:31

编程IT圈的博客本次内容涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处理等所有能在办公场景实现自动化的库，希望能够对大家有所帮助。PythonExcel自动化库// 1.xlwings 库官网：https://www.xlwings.org/特点：xlwings 是...
读取没有Meta.data的单细胞表达矩阵构建Seurat分析对象
2025-01-05 23:53

邢博士谈科教的博客如果是读取的单个表达矩阵文件来构建seurat分析对象的话, 这个表达矩阵文件可以是CSV,TXT, TSV或者csv.gz,txt.gz, tsv.gz 等格式的表格文件单细胞数据集GSE197266，文件在两个压缩包里这个里面只有表达矩阵文件，...
实用！34个Python 自动化办公库清单
2021-11-11 13:00

lyc2016012170的博客来源：牛稳稳大家好，我是辰哥~今天给大家分析34个常用的Python自动化办公库本次内容涵盖了Excel、Word、PPT、ODF、PDF、邮件、微信、文件处理等所有能在办公场景实现自动化...
语料库与python应用 pdf文件_python-nlp ch2笔记2：不同文件格式的语料、免费语料库资源、nlp数据准备流程...
2020-12-08 23:18

weixin_39759441的博客本帖是对(印度)Jalaj Thanaki作品《python自然语言处理》张金超、刘舒曼译本的缩减及改编~不同文件格式的语料语料有不同的格式。在实践中，我们可以使用下面的文件格式。所有的这些文件格式一般都用来存储特征，并在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月12日

python处理tsv文件矩阵

5条回答 默认 最新

问题事件

5条回答默认最新