python DNA序列转化为蛋白质序列
利用python将 “1.txt” 文件中一段长度不限的DNA序列转换成氨基酸序列,并输出结果到 “1t.txt” 文件。
遇到问题请指点。
“1.txt” 文件:
ATGCACCACTTAAGATCAGCGCTGCCTTATGCC
python代码:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
with open('1.txt', 'r') as f, open('1t.txt', 'w') as f_out:
def translate(seq):
table = {
"TTT":"F", "TTC":"F", "TTA":"L", "TTG":"L",
"TCT":"S", "TCC":"S", "TCA":"S", "TCG":"S",
"TAT":"Y", "TAC":"Y", "TAA":"*", "TAG":"*",
"TGT":"C", "TGC":"C", "TGA":"*", "TGG":"W",
"CTT":"L", "CTC":"L", "CTA":"L", "CTG":"L",
"CCT":"P", "CCC":"P", "CCA":"P", "CCG":"P",
"CAT":"H", "CAC":"H", "CAA":"Q", "CAG":"Q",
"CGT":"R", "CGC":"R", "CGA":"R", "CGG":"R",
"ATT":"I", "ATC":"I", "ATA":"I", "ATG":"M",
"ACT":"T", "ACC":"T", "ACA":"T", "ACG":"T",
"AAT":"N", "AAC":"N", "AAA":"K", "AAG":"K",
"AGT":"S", "AGC":"S", "AGA":"R", "AGG":"R",
"GTT":"V", "GTC":"V", "GTA":"V", "GTG":"V",
"GCT":"A", "GCC":"A", "GCA":"A", "GCG":"A",
"GAT":"D", "GAC":"D", "GAA":"E", "GAG":"E",
"GGT":"G", "GGC":"G", "GGA":"G", "GGG":"G"
}
def translate(seq):
protein =""
for i in range(0, len(seq), 3):
codon = seq[i:i+3]
if codon in table:
protein += table[codon]
else:
protein += 'X'
with open('1t.txt', 'w') as f:
f.write(protein)