Shaquila_Chau 2021-11-09 17:23 采纳率: 70%
浏览 14
已结题

请问python去重/合并怎么实现?

现在有文本数据:
chr1 12176 12178 region1
chr1 12178 12182 region2
chr1 12182 12194 region3
chr1 12194 12215 region4
chr1 12215 12232 region5
chr1 12232 12233 region6
chr1 12235 12238 region7
chr1 12238 12242 region8
chr1 12242 12250 region9
chr1 12255 12260 region10
我想要把他们变成:
chr1 12176 12233 region1+region2+region3+region4+region5+region6
chr1 12235 12250 region7+region8+region9
chr1 12255 12260 region10
我应该在python上怎么实现?

  • 写回答

1条回答 默认 最新

  • Fioman_Hammer 2021-11-09 18:01
    关注
    
    dataList = []
    with open("a.txt","r") as f:
        while True:
            data = f.readline().strip()
            print(data)
            if not data:
                break
            dataList.append(data.split(" "))
    
    dataNewList = []
    for index,data in enumerate(dataList):
        if index == 0:
            dataNewList.append(data)
        else:
            if data[1] == dataNewList[-1][2]:
                newData = dataNewList[-1]
                newData[2] = data[2]
                newData[3] = newData[3] + "+" + data[3]
                dataNewList[-1] = newData
            else:
                newData = data
                dataNewList.append(newData)
    
    # 转换为字符串
    strList = []
    for line in dataNewList:
        newLine = " ".join(line)
        strList.append(newLine)
    
    for s in strList:
        print(s)
    
    with open("a.txt","w") as f:
        for s in strList:
            f.write(s + "\n")
    

    结果:

    img

    如果觉得答案对你有帮助,请点击下采纳,谢谢~

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月17日
  • 已采纳回答 11月9日
  • 创建了问题 11月9日

悬赏问题

  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容