如何实现读取多个文件夹下的fasta文件，大脑缺氧，求救命！

如何实现读取多个文件夹下的fasta文件！
一下这一串文件分别存于FANCE,和FANCD的文件夹中。但下面的必须手敲所有文件名去选取，实在敲不动了！求各路大神，高人指点！小女子就此谢过！
proteinNames = ['FANCE1020_1080', 'FANCD21_60', 'FANCD260_120', 'FANCD2120_180', 'FANCD2180_240',
'FANCD2240_300', 'FANCD2300_360', 'FANCD2360_420', 'FANCD2420_480', 'FANCD2480_540',
'FANCD2540_600', 'FANCD2600_660', 'FANCD2660_720', 'FANCD2720_780', 'FANCD2780_840',
'FANCD2840_900', 'FANCD2900_960', 'FANCD2960_1020', 'FANCD21020_1080', 'FANCD21080_1140',
'FANCD21140_1200', 'FANCD21200_1260', 'FANCD21260_1320', 'FANCD21320_1380', 'FANCD21380_1440',
'FANCD21440_1500', 'FANCD21500_1566', 'FANCD2_alignment']

谢！
谢！
谢！
各路大神！

import numpy as np
from matplotlib import pyplot as plt
import PPI as ppi
from sklearn import manifold
import xlrd
import xlwt

# Fanconia Anemia proteins files, D2.fasta, L.fasta,
# shall exist in the sub-folder ./PPIData. These files contain the corresponding protein sequences from Fanconia Anemia
proteinNames = ['FANCE1020_1080', 'FANCD21_60', 'FANCD260_120', 'FANCD2120_180', 'FANCD2180_240',
                'FANCD2240_300', 'FANCD2300_360', 'FANCD2360_420', 'FANCD2420_480', 'FANCD2480_540',
                'FANCD2540_600', 'FANCD2600_660', 'FANCD2660_720', 'FANCD2720_780', 'FANCD2780_840',
                'FANCD2840_900', 'FANCD2900_960', 'FANCD2960_1020', 'FANCD21020_1080', 'FANCD21080_1140',
                'FANCD21140_1200', 'FANCD21200_1260', 'FANCD21260_1320', 'FANCD21320_1380', 'FANCD21380_1440',
                'FANCD21440_1500', 'FANCD21500_1566', 'FANCD2_alignment']
n = len(proteinNames)
n = len(proteinNames)
distM = np.zeros([n, n])
distV = []

for i in range(0, n):
    nameA = proteinNames[i]
    proteinsA = ppi.getAllSequences(nameA)  # The Fanconi Anemia file: one file contain the same protein for different geneomes
    print(nameA, len(proteinsA))
    for j in range(0, n):
        nameB = proteinNames[j]
        proteinsB = ppi.getAllSequences(nameB)
        print(nameB, len(proteinsB))
        dist = 1 - ppi.scorePPITreesP(proteinsA, proteinsB)
        distV.append(dist)
        distM[i, j] = dist
        print(nameA, nameB, dist)
        print(ppi.scorePPITreesP(proteinsA, proteinsB))
print(distM)
print()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃鸡王者 2019-07-04 09:18
关注
使用os.listdir('目录路径') 列表形式返回该目录下的所有文件名，然后你再依次读取和处理就ok了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

如何实现读取多个文件夹下的fasta文件，大脑缺氧，求救命！ python
2019-07-03 21:26

回答 2 已采纳使用os.listdir('目录路径') 列表形式返回该目录下的所有文件名，然后你再依次读取和处理就ok了
怎么用python修改fasta序列的ID名字 python
2022-04-19 08:29

回答 1 已采纳 import re def run(): fasta_str = """WP_018731760.1 NAD(P)-binding domain-containing protein [Sal
怎么用Python将Excel转化为fasta？ python 有问必答
2022-04-11 12:04

回答 3 已采纳在github上有处理代码，可参考一下：https://github.com/kuod/cctf/blob/master/parser.py
使用Python程序读取fasta文件reads
2022-12-15 21:23

小飞棍来喽~的博客使用Python程序读取fasta文件reads
shell或python脚本批量处理txt文件 bash linux python 有问必答
2022-03-20 04:01

回答 6 已采纳 # -*- utf8 -*- """ pyCode : test.py Created by: Taro Description: 2022/3/20 0020 """ import os impor
初学python，批量选取文件中某一部分内容，然后将内容逐条存于一个文件中 python
2019-06-27 20:46

回答 2 已采纳 ``` # -*- coding:utf-8 -*- import os from Bio import SeqIO # root_dir为要读取文件的根目录 root_dir =
比较两个fasta序列的碱基个数并提取ATG及之后的序列 python 有问必答
2021-05-19 15:51

回答 2 已采纳参考一下：https://blog.csdn.net/david10251025/article/details/102093869
使用Python脚本读取fasta文件
2022-09-13 22:52

μμ豆奶的博客使用Python脚本读取fasta文件
为什么老师的Python2能产生一个TXT文件而我的python3却不能？ python
2017-04-25 05:44

回答 3 已采纳 try this ``` if __name__=="__main__": main(args) ```
如何用python写一个循环，或者其他方式，完成批量选取内容并保存。 python
2019-06-27 21:38

回答 3 已采纳 from Bio import SeqIO for xx in range(1, 68): xn = "split__" + str(xx) + ".fasta" yn = "selec
Python获取基因库序列并排序 python 有问必答
2021-05-29 00:51

回答 2 已采纳 list index out of range 错误出现的原因主要有两个，一个可能是下标超出范围，一个可能是list是空的，没有一个元素比如 a = random.randint(0,
利用Python读取fasta文件并进行一系列操作（上）
2021-06-18 22:13

yhlhhhh的博客利用Python读取fasta文件并进行一系列操作（上）概述语言：python3.8 模块：pysam collections 可选：jupyter 整体思路：将fasta格式的基因原始数据处理为方便读写的txt格式并进行操作步骤：获取自己的fasta...
re.sub()对A文件中每个以>开头的字符串，在B文件查找并以该字符串在B所在列名替换A中的该字符串 python 大数据有问必答正则表达式
2021-10-26 10:35

回答 1 已采纳是不是类似这样操作，循环替换。 import re s=['gene>ggcctt>tggc','gene>ctct'] s1=[] for x in s: x1=re.s
【python拆分fasta文件为多个小的fasta文件】
2022-03-23 14:51

生信学习的博客 #这里我写了一个判断参数，这里输入参数：fa文件，拆分数，输出文件夹 if len(sys.argv)>3 and len(sys.argv)<5: fasta=sys.argv[1] #读取文件 n=sys.argv[2] #分成数 n=int(n) out_file = sys.argv[3] #...
使用python读取和分析fasta文件
2019-12-05 20:28

晔晔炅萤的博客分享一些处理fasta文件的python函数
分割fasta文件的python脚本
2018-08-21 11:54

文件脚本可将大的fasta文件中的序列，按照个数均分，分割成多个fasta文件，便于对各个小文件中的序列进行后续操作
make-multiFASTA:使用该文件夹中的所有FASTA文件创建一个multiFASTA
2021-04-06 00:59

制造多重FASTA 使用该文件夹中的所有FASTA文件创建一个multiFASTA。
python导出csv文件、统计每个出现的次数_Python脚本：fasta文件多序列信息统计
2020-11-30 10:47

weixin_39860946的博客设计需求统计fasta文件中多条序列信息，设计目标效果：图片.png将结果输入到csv格式的表格中，因为csv格式表格用，分隔数据。脚本使用argparse模块，提示输入数据。import argparseparser = argparse.ArgumentParser...
python处理fasta文件,使用生成器（python）解析fasta文件
2020-12-14 16:36

何老师Matt的博客 I am trying to parse a large fasta file and I am encountering out of memory errors. Some suggestions to improve the data handling would be appreciated. Currently the program correctly prints out the n...
DNA-FASTA-Python:使用Python分析Multi-Fasta格式的DNA序列
2021-05-04 02:17

一个Python程序，将包含多FASTA格式的DNA序列的文件作为输入，并计算以下问题的答案：文件中有几条记录？ FASTA文件中的记录定义为单行标题，后跟序列数据行。在第一列中，标题行与序列数据之间用大于号（“>”）...
没有解决我的问题, 去提问

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘

如何实现读取多个文件夹下的fasta文件，大脑缺氧，求救命！

2条回答 默认 最新

悬赏问题

2条回答默认最新