脚本2:
perl /mnt/sdb/share/bin/deal_fa.pl
数据路径:/mnt/sdb/share/bin/linux-demo/program/fasta
要求:
1.过滤掉长度1000bp一下的序列
2.提取目标区域(region.txt)内的序列
3.计算每个scaffold序列的长度
4.以100bp为窗口计算scaffold窗口内的GC含量
5.scaffold序列基本信息统计(N50,N90,最大长度,最小长度等)
6.以300个N链接scaffold序列
7.scaffold的拆分为contig
8.每两个序列拆分为一个文件
9.反向互补scaffold的序列
10.把不标准的scaffold的序列变成标准的scaffold的序列
11.fasta文件转化为fastq格式文件
12.修改fasta序列前缀名称;前缀为: part