如何实现读取多个文件夹下的fasta文件，大脑缺氧，求救命！

如何实现读取多个文件夹下的fasta文件！
一下这一串文件分别存于FANCE,和FANCD的文件夹中。但下面的必须手敲所有文件名去选取，实在敲不动了！求各路大神，高人指点！小女子就此谢过！
proteinNames = ['FANCE1020_1080', 'FANCD21_60', 'FANCD260_120', 'FANCD2120_180', 'FANCD2180_240',
'FANCD2240_300', 'FANCD2300_360', 'FANCD2360_420', 'FANCD2420_480', 'FANCD2480_540',
'FANCD2540_600', 'FANCD2600_660', 'FANCD2660_720', 'FANCD2720_780', 'FANCD2780_840',
'FANCD2840_900', 'FANCD2900_960', 'FANCD2960_1020', 'FANCD21020_1080', 'FANCD21080_1140',
'FANCD21140_1200', 'FANCD21200_1260', 'FANCD21260_1320', 'FANCD21320_1380', 'FANCD21380_1440',
'FANCD21440_1500', 'FANCD21500_1566', 'FANCD2_alignment']

谢！
谢！
谢！
各路大神！

import numpy as np
from matplotlib import pyplot as plt
import PPI as ppi
from sklearn import manifold
import xlrd
import xlwt

# Fanconia Anemia proteins files, D2.fasta, L.fasta,
# shall exist in the sub-folder ./PPIData. These files contain the corresponding protein sequences from Fanconia Anemia
proteinNames = ['FANCE1020_1080', 'FANCD21_60', 'FANCD260_120', 'FANCD2120_180', 'FANCD2180_240',
                'FANCD2240_300', 'FANCD2300_360', 'FANCD2360_420', 'FANCD2420_480', 'FANCD2480_540',
                'FANCD2540_600', 'FANCD2600_660', 'FANCD2660_720', 'FANCD2720_780', 'FANCD2780_840',
                'FANCD2840_900', 'FANCD2900_960', 'FANCD2960_1020', 'FANCD21020_1080', 'FANCD21080_1140',
                'FANCD21140_1200', 'FANCD21200_1260', 'FANCD21260_1320', 'FANCD21320_1380', 'FANCD21380_1440',
                'FANCD21440_1500', 'FANCD21500_1566', 'FANCD2_alignment']
n = len(proteinNames)
n = len(proteinNames)
distM = np.zeros([n, n])
distV = []

for i in range(0, n):
    nameA = proteinNames[i]
    proteinsA = ppi.getAllSequences(nameA)  # The Fanconi Anemia file: one file contain the same protein for different geneomes
    print(nameA, len(proteinsA))
    for j in range(0, n):
        nameB = proteinNames[j]
        proteinsB = ppi.getAllSequences(nameB)
        print(nameB, len(proteinsB))
        dist = 1 - ppi.scorePPITreesP(proteinsA, proteinsB)
        distV.append(dist)
        distM[i, j] = dist
        print(nameA, nameB, dist)
        print(ppi.scorePPITreesP(proteinsA, proteinsB))
print(distM)
print()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃鸡王者 2019-07-04 09:18
关注
使用os.listdir('目录路径') 列表形式返回该目录下的所有文件名，然后你再依次读取和处理就ok了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

使用Python程序读取fasta文件reads
2022-12-15 21:23

小飞棍来喽~的博客使用Python程序读取fasta文件reads
使用Python脚本读取fasta文件
2022-09-13 22:52

μμ豆奶的博客使用Python脚本读取fasta文件
【python拆分fasta文件为多个小的fasta文件】
2022-03-23 14:51

生信学习的博客 #这里我写了一个判断参数，这里输入参数：fa文件，拆分数，输出文件夹 if len(sys.argv)>3 and len(sys.argv)<5: fasta=sys.argv[1] #读取文件 n=sys.argv[2] #分成数 n=int(n) out_file = sys.argv[3] #...
make-multiFASTA:使用该文件夹中的所有FASTA文件创建一个multiFASTA
2021-04-06 00:59

4. **构建multiFASTA**：随着所有文件的遍历完成，程序将所有读取到的序列组合成一个大的多序列FASTA文件，每个原始文件的序列之间用空行分隔。 5. **写入输出**：最后，使用Python的`write()`函数，将这个...
使用python读取和分析fasta文件
2019-12-05 20:28

晔晔炅萤的博客分享一些处理fasta文件的python函数
分割fasta文件的python脚本
2018-08-21 11:54

文件脚本可将大的fasta文件中的序列，按照个数均分，分割成多个fasta文件，便于对各个小文件中的序列进行后续操作
利用Python读取fasta文件并进行一系列操作（上）
2021-06-18 22:13

yhlhhhh的博客利用Python读取fasta文件并进行一系列操作（上）概述语言：python3.8 模块：pysam collections 可选：jupyter 整体思路：将fasta格式的基因原始数据处理为方便读写的txt格式并进行操作步骤：获取自己的fasta...
python 读取fasta中的所有序列
2024-08-13 04:24

Gorov的博客如何使用 Python 读取 FASTA 文件中的所有序列在生物信息学中，FAST格式（FASTA）是一种...本文将指导你通过一个简单的步骤，使用Python读取FASTA文件中的所有序列。我们将逐步展示每一步需要执行的代码，并用注...
Remove-duplicate-fasta:Python脚本删除重复的Fasta序列
2021-05-13 22:21

-Python script to remove whole duplicate fasta sequences i.e identical sequence and header -input file must be in fasta format usage: python remove_duplicate_fasta.py inputfile outputfile 例子： ...
【python】使用pysam读取sam/vcf/fasta文件时的常用属性
2022-08-04 17:15

青灯照颦微的博客判定该记录序列信息是read1或read2，是否是反向比对？判定该记录序列信息是否未比对上？配对序列是否反向比对？配对序列是否未比对上...读取sam文件时，熟悉一些常用的属性。如何将读取的信息转换成字符？............
python处理fasta文件_Python脚本：fasta文件单序列信息提取
2020-12-14 16:36

weixin_39810901的博客使用Python对fasta格式的序列进行基本信息统计预期设计输出文件中包括fasta文件名，序列长度，GC含量以及ATCG各自的含量。Python脚本编辑使用的文件test.fastastat.py输入 sys模块#!/usr/bin/env pythonimport sys从...
pyhtslib:使用htslib从Python文件读取HTS
2021-05-20 04:59

pyhtslib-从Python访问HTS文件Python库pyhtslib是htslib的包装，是一个C库，用于访问用于高通量排序（HTS）文件格式的文件。 pyhtslib的目的是通过易于使用且经过良好测试的Python界面提供htslib的I / O功能。地位...
FindTelomeres：用于在FASTA文件中查找端粒重复序列（TTAGGGCCCTAA）的python脚本
2021-02-18 18:00

这是用于在FASTA文件中查找端粒重复序列（TTAGGG / CCCTAA）的工具。该脚本不做什么？它只会在序列的开头和结尾寻找端粒。它仅查找TTAGGG / CCCTAA重复序列的变体。它是如何做到的？它以FASTA文件作为输入，...
Python读取fasta格式数据成为字典形式。
2024-08-23 15:29

图灵生信的博客 Python读取Fastq格式数据成为字典形式。
python导出csv文件、统计每个出现的次数_Python脚本：fasta文件多序列信息统计
2020-11-30 10:47

weixin_39860946的博客设计需求统计fasta文件中多条序列信息，设计目标效果：图片.png将结果输入到csv格式的表格中，因为csv格式表格用，分隔数据。脚本使用argparse模块，提示输入数据。import argparseparser = argparse.ArgumentParser...
如何使用Python将fastq文件转化成fasta文件
2024-05-24 10:05

Mr.P°Cr的博客如何使用Python将fastq文件转化成fasta文件
python处理fasta文件,使用生成器（python）解析fasta文件
2020-12-14 16:36

何老师Matt的博客 I am trying to parse a large fasta file and I am encountering out of memory errors. Some suggestions to improve the data handling would be appreciated. Currently the program correctly prints out the n...
基于Python的生物学文件格式解析转换设计源码
2024-10-02 01:53

项目中包含的21个Python源代码文件构成了工具的核心功能，它们负责读取、解析、转换以及输出各种生物数据格式。项目还包含文档描述文件，这些文件对项目的安装、使用和维护提供了详细的指导。它们是项目可读性和可...
利用Python读取fasta文件并进行一系列操作（二）
2021-06-20 21:11

yhlhhhh的博客利用Python读取fasta文件并进行一系列操作（二）概览：本节目标：通过上一节所输出的txt输出ABO蛋白以及ABO基因的外显子fasta文件语言： python3.8 模块：biopython ssl 可选：jupyter 整体思路：通过ncbi获取...
python打开文件报错无效序列_如何在python中读取fasta文件？
2020-12-01 22:17

weixin_39839968的博客我正在尝试读取FASTA文件,然后查找特定的motif(string)并打印出序列和次数. AFASTA file只是一系列序列(字符串),以标题行开头,标题或新序列的开头是“>”.在标题之后的一个新行中是字母序列.我没有完成代码但到...
没有解决我的问题, 去提问

如何实现读取多个文件夹下的fasta文件，大脑缺氧，求救命！

2条回答 默认 最新

2条回答默认最新