在 deal-fa.pl 找对应的指令求解

脚本2：
perl /mnt/sdb/share/bin/deal_fa.pl
数据路径：/mnt/sdb/share/bin/linux-demo/program/fasta
要求：

过滤掉长度1000bp一下的序列
提取目标区域（region.txt）内的序列
计算每个scaffold序列的长度
以100bp为窗口计算scaffold窗口内的GC含量
scaffold序列基本信息统计（N50，N90，最大长度，最小长度等）
以300个N链接scaffold序列
scaffold的拆分为contig
每两个序列拆分为一个文件
反向互补scaffold的序列
把不标准的scaffold的序列变成标准的scaffold的序列
fasta文件转化为fastq格式文件
修改fasta序列前缀名称；前缀为： part

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-09-13 20:18
关注
【以下回答由 GPT 生成】

是的，您所描述的内容正确无误。以下是针对每个问题的解决方案：

过滤掉长度小于1000bp的序列：

awk 'BEGIN{RS=">";ORS=""}{if(length($0)>1000)print ">"$0}' input.fasta > output.fasta

从region.txt文件中提取目标区域内的序列：

bedtools getfasta -fi input.fasta -bed region.txt -fo output.fasta

计算每个scaffold序列的长度：

awk '/^>/ {if (seqlen){print seqlen}; print; seqlen=0; next;} { seqlen += length($0); } END {print seqlen}' input.fasta > output.txt

使用100bp的窗口计算scaffold窗口内的GC含量：

bedtools nuc -fi input.fasta -bed windows.bed > output.txt

对scaffold序列进行基本信息统计，如N50、N90、最大长度、最小长度等：

biopython 或其他第三方库可以进行此项统计

使用300个N将scaffold序列连接起来：

awk '/^>/ {if (seqlen){print "\n" }; print; seqlen=0; next;} { seqlen += length($0); printf("%s", $0); } END {print }' input.fasta | awk -vRS="" '{gsub (/\n/,"NNNNNNNNN\n"); print }' > output.fasta

将scaffold拆分为contig：

awk '/^>/{s=++i".fasta"} {print > s}' RS=">" input.fasta

将每两个序列拆分为一个文件：

split -l 2 input.fasta

对scaffold序列进行反向互补操作：

seqtk seq -r input.fasta > output.fasta

将不符合标准的scaffold序列转换为标准的scaffold序列：

biopython 或其他第三方库可以进行此项操作

将fasta文件转化为fastq格式文件：

awk '/^>/ {print $0"@seq"}; /^[^>]/ {print $0"+\n""~"}' input.fasta > output.fastq

修改fasta序列的前缀名称，将前缀改为"part"：

awk '/^>/{print ">part" ++i; next}{print}' input.fasta > output.fasta

如果您还有其他问题，请随时提问。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Base64图像解码问题 - 空.png文件？ ajax javascript php
2017-04-12 18:36

回答 1 已采纳 It should be $img = $_POST['imgBase64']; not $img = $_POST['data']; as your data object's key name
MySQL - 编码为charset windows-1251的数据未在服务器上显示 database mysql php
2017-03-06 15:59

回答 1 已采纳 Either use MySQL's CHARACTER SET utf8 or cp1251. You will need to switch to that charset througho
限制变量存储错误的范围
2016-04-10 14:44

回答 2 已采纳 First, there's no need to isolate variables. Second, you can do short-hand assignment inside if st
【Docker】--6.外部调用docker指令,shell脚本
2022-10-18 17:20

终问鼎的博客通过外部运行API方式让本地1.txt 2.in 3.in传入docker的/app/exec路径下作为输入文件,执行可执行程序deal,最终获得1.ou 2.ou 3.ou再传入docker外,即本地.对docker exec命令要有更深的认识,如下的意思是,在my_ubuntu...
滑动安装go-ethereum依赖项和bidmint依赖项
2018-09-04 10:17

回答 1 已采纳 I figure it out, just set the mirror, and ignore some package, like this glide mirror set https:/
错误消息“禁止您在另一台PC上没有访问/在此服务器上的权限” apache php
2015-11-18 09:29

回答 1 已采纳 Try: <Directory "c:/wamp/www/"> ... #Require local Order allow,deny Allow from all Require
java scanner 对于多行销售数据的读取并找出最大和最小单价的对应的信息还有不同商品其对应的的数据平均值 java 有问必答
2022-09-20 10:30

回答 2 已采纳 import java.io.File; import java.text.DecimalFormat; import java.util.ArrayList; import java.util.H
npm 安装 bin/npm: line 1: ../lib/node_modules/npm/bin/npm-cli.js: No such file or directory
2017-04-06 20:28

衣舞晨风的博客 # If this fails, it's not such a big deal. configures= "`env | grep 'npm_config_' | sed -e 's|^npm_config_||g'`" npm_config_loglevel= "error" if [ "x $npm_debug " = "x" ]; then ( exit 0...
thinkphp $deal.val的定义 html5 php
2015-08-19 06:49

回答 2 已采纳通过找到html所在的view，找到对应的controller里面的方法，在方法中找到`$this->assign()` ，一定有一个是`$this->assign('deal', $de
PHP CURL脚本在第一次请求后获得502/503服务器错误 php
2019-01-15 04:03

回答 1 已采纳 There is a mess of cookies in your snippet. The callback function just appends cookies to the arra
如何使用PHP连接Dropzone.js中的chunked文件上传？ jquery php
2019-05-15 19:28

回答 1 已采纳 I figured it out! The problem is that I was trying to call the concatenation loop when $chunkIndex
go 使用 - sync.Metux
2023-12-27 16:02

Q_X_Q 慶的博客 i++ { mutex.Lock() // 对共享资源的简单访问 mutex.Unlock() } // 如果循环体内有复杂的逻辑，而且锁的粒度比较大，可能需要在循环外加锁，以避免在每次迭代时频繁地获取和释放锁，从而降低性能 mutex.Lock() ...
在使用hive软件创建自定义函数时报错 qwq hive 有问必答
2021-09-05 21:18

回答 1 已采纳堆内存溢出了，你可以参考一下这篇文章解决 Error while processing statement: FAILED: Execution Error, return code 1
LeetCode-中等-18. 四数之和
2021-12-28 13:00

Hugh_777_的博客请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] （若两个四元组元素一一对应，则认为两个四元组重复）： 0 <= a, b, c, d < n a、b、c 和 d 互不相同 nums[a] + nums...
wx小程序反编译脚本wxappUnpacker-master.zip和所需的依赖分享
2020-04-07 14:39

kujieyinse的博客看了好多小程序的反编译所需脚本都失效，最后终于找到所需的脚本，还有依赖，依赖服务器下不动，开了科学后才下载成功。教程就不提供了，一搜一大堆。在此，让困扰我许久，寻找许久的这两个文件分享下，下面可...
Kafka详解（中）——Kafka客户端操作
2022-04-27 21:26

98seven的博客下表列举了3.0版本支持的所有参数用法：参数值类型说明有效值 –bootstrap-server String 要连接的服务器 必需(除非指定–broker-list，但broker-list在新版本中已过时) 形如：host1:prot1,host2:prot2 –...
求解偏微分方程开源有限元软件deal.II学习--Step 3
2016-08-30 15:03

北冥有鱼虚空充盈的博客求解偏微分方程开源有限元软件deal.II学习--Step 3 Posted on 2016-08-25 | In computational material science | 暂无评论引子这是使用有限元法进行具体计算的第一个算例，求解的是一个简化的Possion方程，...
jquery-svg-pan-zoom实现svg拖拽放大
2019-07-06 14:29

ionluo的博客原理：控制svg的viewbox属性 viewbox是SVG图像的一个属性，它定义了SVG的可见区域，由4个数字定义：横坐标X、纵坐标Y、宽度Width、高度Height。这些数字一起指定可见区域。这个插件通过操纵这四个数字来工...
机器学习-sklearn.datasets-load_iris数据集-回归算法和K近邻法(KNN)
2020-07-29 20:10

有树枝的ikun丶的博客学习机器学习一个月了，开始尝试做一些简单的问题，整体代码在文章最后这里写目录标题1、 load_iris数据集2、数据集处理3、线性回归3.1 回归训练3.2 回归测试3.3 对输入点进行判断4、K近邻(KNN)算法4.1 距离计算4.2...
docker-compose整合FastDFS
2022-04-11 21:06

一米阳光zw的博客超简单的部署FastDFS方式，之前lz也发布过如何在服务器直接安装部署fastdfs与nginx，过程是否麻烦并且没有一定基础的人不一定能部署好，但是使用现在的方式部署，那真的是妈妈再也不用担心我部署的FastDFS无法使用，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月13日

悬赏问题

¥20 双硬盘安装Ubuntu后windows 无法挂载硬盘
¥15 下面求极限的步骤哪里不对，正确答案是a1a2…an
¥15 帮我利用jupyter 运行一个正确的代码
¥15 如何使用Gephi软件和Python包中的GephiStreamer交互
¥15 sqlite加密问题咨询
¥15 appdesigner接收不到udp组播的数据
¥15 verilog 非阻塞赋值下的移位拼接错误
¥100 两个按钮控制一个LED
¥15 用C语言写离散数学相关问题
¥30 如何用python的GephiStreamer连接到gephi中，把Python和Gephi的具体操作过程都展示，重点回答Gephi软件的调试，以及如果代码的端口在浏览器中无法显示怎么处理

在 deal-fa.pl 找对应的指令 求解

1条回答 默认 最新

问题事件

悬赏问题

在 deal-fa.pl 找对应的指令求解

1条回答默认最新