shell或python脚本批量处理txt文件

有一堆小文本文件，格式为：文件名.m8，其实就是txt文本文件。文件内，一行内容为一条信息，信息内容用tab隔开。

SRR329659.m8文件内容：

SRR329659.5585.1    XXXX    44.8    29    16    14    100    527    555    6.0e-07    35.4    VRRNFPHCMVFAYMDDVVLGAKSVEHLES    GTCCAAAGAGCCTTTCCCTCATGTCTTATATATCACTATATGGACGACATTCTCCTAGCCCATCCCAAACCAGAACAACTTGATTCA
SRR329659.40047.1    XXXX    39.3    28    17    87    4    529    556    5.1e-06    32.3    RNFPHCMVFAYMDDVVLGAKSVEHLESV    AAGTGAATCGAGTTGTTCTGGTTTGGGATGGGCTAGGAGAATGTTGTCCATATAGTGATATATAAGACATGAGGGAAAGGCTCT

现在想：
1，一个bash或者python脚本，提取每一行信息，转换为两行内容，第一行是第一段，且以>开头，第二行是12段。原来两行信息转换以后就变成4行信息。转换到新的文件，文件名.fasta。以上内容就变成：

SRR329659.fasta

>SRR329659.5585.1
VRRNFPHCMVFAYMDDVVLGAKSVEHLES
>SRR329659.40047.1
RNFPHCMVFAYMDDVVLGAKSVEHLESV

2，一个文件夹下有大量类似小文件，需要将这类文件批量转换，文件名.m8，转换成：文件名.fasta。bash或者python脚本输入一个文件夹位置1——里面是待转换文件，输出另外一个文件夹位置2——转换好的文件。
运行命令类似于 bash file-trans.sh 输入文件夹1 输出文件夹2

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

6条回答默认最新

皮尔菲特 2022-03-20 22:33

关注

# -*- utf8 -*-
"""
pyCode : test.py
Created by: Taro
Description:
2022/3/20 0020
"""
import os
import os.path as osp
import sys
if len(sys.argv) != 3:
    print("usage: python trans.py source_dir out_dir")

source_dir = sys.argv[1]
if not osp.exists(source_dir):
    print("input source_dir is not exist,please check!")
out_dir = sys.argv[2]
if not osp.exists(out_dir):
    os.makedirs(out_dir)
count = 0
for root, dirs, files in os.walk(source_dir):
    for f in files:
        if f.endswith(".m8"):
            print("start trans: ", f,)
            count += 1
            infile = osp.join(root, f)
            outfile = f.replace('.m8', ".fasta")
            outfile = osp.join(out_dir, outfile)
            with open(infile, 'r', encoding='utf-8') as inf:
                with open(outfile, 'w', encoding='utf-8') as wf:
                    for i, line in enumerate(inf):
                        # import  pdb
                        # pdb.set_trace()
                        source_line = line.strip().split()
                        line =[]
                        for tmp in source_line:
                            if tmp:
                                line.append(tmp)
                        if len(line) < 12:
                            print("file:{},line:{},format is not right ,please check!")
                            continue
                        else:
                            wf.write(">"+line[0]+"\n"+line[11]+"\n")
            # print("end trans")
print("total trans:", count)

例如拷贝到 test.py 使用方法就是：python test.py inputdir outputdir

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(5条)

报告相同问题？

关注问题

基于Python、CSS、JavaScript、HTML、Shell的多语言编程技术文档源码
2024-10-09 03:42

在当今快速发展的IT行业中，多语言编程已经成为一个不可或缺的技能。本项目提供了一个全面的技术参考，集合了多种编程语言和文件类型，以便开发者能够更全面地掌握和应用多语言编程技术。 Python是一种广泛使用的...
基于Python和Shell的Python脚本在美羊羊队信安赛仓库中的应用设计源码
2024-10-01 10:11

Shell脚本作为Linux操作系统的“胶水语言”，在自动化系统管理、批量处理文件和任务调度方面有着不可替代的作用。通过Python和Shell的结合，可以在不同的层面上实现自动化，提高信安赛仓库的管理效率。在数据管理...
【脚本工具领域】常用实用脚本工具介绍：Shell-Python-PowerShell-JavaScript自动化任务处理提高工作效率
2025-04-18 14:14

Python脚本凭借简洁易读的语法，不仅可处理数据、操作文件，还广泛应用于数据分析、网络编程等领域；PowerShell脚本专注于Windows系统资源管理与系统任务执行，实现自动化操作；JavaScript脚本则服务于网页开发，在...
基于Python和Shell语言的免费API列表设计源码
2024-10-06 00:45

而Shell脚本则可能用于自动化一些重复性操作，比如批量下载API文档或更新API列表等，Shell语言的灵活性和强大的命令行处理能力使得它在自动化脚本编写方面非常实用。此外，项目中包含的3个Markdown文档可能是用来...
基于Python与Shell语言的yolov5花卉识别模型设计源码
2024-09-28 06:02

Shell脚本在数据处理和模型训练过程中具有重要作用，它们可以帮助用户简化复杂的任务，例如批量处理图像数据、自动化训练流程或进行环境部署。在这个项目中，Shell脚本可能用于启动训练流程、管理依赖和环境配置。 ...
基于Python和Shell脚本结合的flower102项目设计源码
2024-10-03 09:09

在当今信息技术高速发展的时代，编程语言Python因其简洁高效而广泛应用于各个领域，尤其在数据处理、机器学习和自动化脚本编写中表现出色。Shell脚本则以其强大的命令行处理能力，在系统管理和自动化运维中占据重要...
Shell和Python脚本都是强大的自动化工具，选择哪种取决于你的具体需求和任务复杂度
2025-04-28 00:00

Bol5261的博客 Shell脚本适合简单的系统管理和任务自动化，而Python脚本则适合复杂的任务和数据处理。在实际使用中，你也可以将它们结合使用，例如使用Shell脚本调用Python脚本，以实现更强大的功能。在Web服务器批量部署和管理...
基于Python和Shell脚本的多功能PDF转文本工具设计源码
2024-10-04 15:59

Shell脚本则被用以实现自动化和批量处理，这在处理大量文件时显得尤为重要。MinerU整合了这两种技术的优势，使得它能够高效地处理各种文档。项目源码包含的文件种类丰富，其中286个文件涉及多种格式。Python脚本...
基于Python和Shell脚本的高效金融数据获取与学习研究设计源码
2025-02-20 06:07

由于Shell脚本在Linux和Unix系统中运行效率高、易于编写和维护，因此对于批量处理文件或执行系统命令来说，Shell脚本是一个很好的选择。项目中还包含4个Markdown格式的说明文档，这种格式的文档在开发者社区中十分...
Python 批量巡检服务器脚本
2024-09-14 21:47

本篇文章将详细解读如何通过Python脚本实现对多个Linux服务器的批量巡检，以及通过自动化处理提高效率的过程。首先，SSH（Secure Shell）协议是服务器远程管理的常用方法，它允许用户在不安全的网络上进行安全的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月20日

shell或python脚本批量处理txt文件

6条回答 默认 最新

问题事件

6条回答默认最新