三筱. 2022-09-18 22:19 采纳率: 90%
浏览 115
已结题

python处理bed文件

处理bed文件,把第四列内容拆分提取出来
存放在字典里,
并输出为txt或者json文件
字典名为patient_genename
例子:ENSG00000186092:OR4F5处理为patient_genename['ENSG00000186092']='OR4F5'

img

  • 写回答

1条回答 默认 最新

  • Elwin Wong 2022-09-18 22:35
    关注

    各个列是用制表符分隔的吗?试试下面的可不可以:

    import pandas as pd
    
    patient_genename = {}
    df = pd.read_csv('file.bed', sep='\t', header=None)
    for item in df[3]:
        kv = item.split(':')
        patient_genename[kv[0]] = kv[1]
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 9月27日
  • 已采纳回答 9月19日
  • 创建了问题 9月18日