三筱. 2022-10-12 11:16 采纳率: 90%
浏览 96
已结题

python处理tsv文件矩阵

现有一个矩阵(tsv文件),行名为ENSG开头+数字编号
前五行五列情况如图

img


现已知行名中,小数点前数值出现重复,小数点后数值不同,
现需要保留小数点后数值最大的行名,去除其他小数点后数值更小的行名
例如:行名为7700.1 7700.2 7700.5的三行,仅保留7700.5所在行
输出一个行名没有重复的新矩阵,列名不变

  • 写回答

5条回答 默认 最新

  • Java大魔王 2022-10-12 11:45
    关注

    思路:字符串分割后分组,分组后比较排序后筛选剔除

    import pandas as pd
    
    df = pd.read_csv('xxxx.tsv', sep='\t')
    df['tempOne'] = df['A'].apply(lambda x: x.split(".")[0])
    df['tempTwo'] = df['A'].apply(lambda x: int(x.split(".")[1]))
    df_new = df.iloc[df.groupby('tempOne').apply(lambda o: o['tempTwo'].idxmax())]
    df_new.drop(['tempOne', 'tempTwo'], axis=1, inplace=True)
    

    源数据:

    img


    结果:

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 10月23日
  • 已采纳回答 10月15日
  • 创建了问题 10月12日

悬赏问题

  • ¥15 安装svn网络有问题怎么办
  • ¥15 Python爬取指定微博话题下的内容,保存为txt
  • ¥15 vue2登录调用后端接口如何实现
  • ¥65 永磁型步进电机PID算法
  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥15 latex怎么处理论文引理引用参考文献