三筱. 2022-10-12 11:16 采纳率: 90%
浏览 96
已结题

python处理tsv文件矩阵

现有一个矩阵(tsv文件),行名为ENSG开头+数字编号
前五行五列情况如图

img


现已知行名中,小数点前数值出现重复,小数点后数值不同,
现需要保留小数点后数值最大的行名,去除其他小数点后数值更小的行名
例如:行名为7700.1 7700.2 7700.5的三行,仅保留7700.5所在行
输出一个行名没有重复的新矩阵,列名不变

  • 写回答

5条回答 默认 最新

  • Java大魔王 2022-10-12 11:45
    关注

    思路:字符串分割后分组,分组后比较排序后筛选剔除

    import pandas as pd
    
    df = pd.read_csv('xxxx.tsv', sep='\t')
    df['tempOne'] = df['A'].apply(lambda x: x.split(".")[0])
    df['tempTwo'] = df['A'].apply(lambda x: int(x.split(".")[1]))
    df_new = df.iloc[df.groupby('tempOne').apply(lambda o: o['tempTwo'].idxmax())]
    df_new.drop(['tempOne', 'tempTwo'], axis=1, inplace=True)
    

    源数据:

    img


    结果:

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 10月23日
  • 已采纳回答 10月15日
  • 创建了问题 10月12日

悬赏问题

  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵