TTTCCTTTTTTTGAACAGATGATTTTAGTGAGCACTGCGCTAGGAGTATGTGTTGAATCTCCAACCCTCGGAACATAGTCGTTGCTCTTGCGGACTGAGA
>read_170_2_1 random_genome_10000000 5846156 100
GGAATCTGCAACTCGGATGGCCGTCTCAAGTAAGCAACAACATTGTTGCTTGCGGCTTCCCGGGTGTCGCTAAGCGTTTAAAAAGTTGTTAGGATTAACC
>read_170_3_1 random_genome_10000000 9709431 100
有100W行DNA序列(上面只给出两行),现在只需要读取DNA序列部分到数组里 >read后面部分不需要,改如何编程?
数据在txt文件中
求个代码~
追答import os
filename= "DNA.txt"
filenameoutput="a.txt"
fp=open(filename,"r")
i=1
fpw=open(filenameoutput,"w")
for line in fp.readlines():
if i%2==1:
## print(line)
fpw.write(line)
i+=1
else:
i+=1
## print(line)
fp.close()
fpw.close()
只保留奇数行。保存在a.txt文档中。
不行的话,还可以用正则来做。
每段DNA序列和>read共同组成一行0.0 保留奇数行不对诶
追答从文件看着不像啊。你给我发给一段文件。我用其他方式实现吧。ID是扣扣。
追问发送了~
追答保存偶数行就可以了。将i%2==1改成==0就可以了。
本回答被提问者和网友采纳Python使用Tensorflow读取CSV数据训练DNN深度学习模型