Win汤er 2021-10-26 10:35 采纳率: 66.7%
浏览 44
已结题

re.sub()对A文件中每个以>开头的字符串,在B文件查找并以该字符串在B所在列名替换A中的该字符串

您好,我有100多个.faa文件(蛋白序列文件),想要对其中的>开头的字符串进行替换,需要替换成B表格文件(物种-序列对应表)中的列名。
我尝试用python中的re.sub()进行查找替换,但总是报错。
下面是我使用的代码:

import pandas as pd
import re
from Bio import SeqIO
matrixlist=pd.read_excel("/mnt/f/MAGs/meishan7/downstram/MGIItree/test/gene1.xlsx")
a=pd.DataFrame(matrixlist)
idlist=[]
seqlist=[]
dictpro={}
for seq in SeqIO.parse('/mnt/f/MAGs/meishan7/downstram/MGIItree/test/proteins.faa','fasta'):
    pid=seq.id
    seq=seq.seq


  • 写回答

1条回答 默认 最新

  • CSDN专家-HGJ 2021-10-26 10:46
    关注

    是不是类似这样操作,循环替换。

    import re
    
    s=['gene>ggcctt>tggc','gene>ctct']
    s1=[]
    for x in s:
        x1=re.sub('>',"",x)
        s1.append(x1)
    print(s1)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月3日
  • 已采纳回答 10月26日
  • 创建了问题 10月26日

悬赏问题

  • ¥15 基于卷积神经网络的声纹识别
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图
  • ¥15 写一个方法checkPerson,入参实体类Person,出参布尔值
  • ¥15 我想咨询一下路面纹理三维点云数据处理的一些问题,上传的坐标文件里是怎么对无序点进行编号的,以及xy坐标在处理的时候是进行整体模型分片处理的吗
  • ¥15 CSAPPattacklab
  • ¥15 一直显示正在等待HID—ISP
  • ¥15 Python turtle 画图
  • ¥15 stm32开发clion时遇到的编译问题