【Python小试】去除核酸特定长度的接头序列

输入

input.txt

ATTCGATTATAAGCTCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATC
ATTCGATTATAAGCACTGATCGATCGATCGATCGATCGATGCTATCGTCGT
ATTCGATTATAAGCATCGATCACGATCTATCGTACGTATGCATATCGATATCGATCGTAGTC
ATTCGATTATAAGCACTATCGATGATCTAGCTACGATCGTAGCTGTA
ATTCGATTATAAGCACTAGCTAGTCTCGATGCATGATCAGCTTAGCTGATGATGCTATGCA

编码

file = open("input.txt")
output = open("trimmed.txt","w")

for dna in file:
    trimmed_dna = dna[14:] #接头特定长度14
    trimmed_length = len(trimmed_dna) - 1
    output.write(trimmed_dna)

    print("processed sequence with length" + str(trimmed_length))

输出

trimmed.txt

TCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATC
ACTGATCGATCGATCGATCGATCGATGCTATCGTCGT
ATCGATCACGATCTATCGTACGTATGCATATCGATATCGATCGTAGTC
ACTATCGATGATCTAGCTACGATCGTAGCTGTA
ACTAGCTAGTCTCGATGCATGATCAGCTTAGCTGATGATGCTATGCA
原文地址:https://www.cnblogs.com/jessepeng/p/12741453.html