[med-svn] [Git][med-team/seqsero][upstream] New upstream version 1.0.1+dfsg
Andreas Tille
gitlab at salsa.debian.org
Mon Sep 3 18:35:37 BST 2018
Andreas Tille pushed to branch upstream at Debian Med / seqsero
Commits:
38260da9 by Andreas Tille at 2018-09-03T17:31:55Z
New upstream version 1.0.1+dfsg
- - - - -
11 changed files:
- README.md
- SeqSero.py
- database/FliC_Family_k,z_special_genes.fasta
- database/FliC_Family_l,v_special_genes.fasta
- database/FljB_1_2_7_whole.fasta
- database/H_new_fliC_protein_database.fasta
- database/special_O_genes.fasta
- database/special_new_O_genes.fasta
- libs/BWA_analysis_H_update_new_family_dependent.py
- libs/BWA_analysis_O_new_dependent.py
- libs/split_interleaved_fastq.pl
Changes:
=====================================
README.md
=====================================
@@ -1,4 +1,4 @@
-# SeqSero 1.0
+# SeqSero
Salmonella serotyping from genome sequencing data
=====================================
SeqSero.py
=====================================
@@ -11,7 +11,8 @@ def main():
parser = argparse.ArgumentParser(usage='SeqSero.py -m <data_type> -i <input_data> [-b <BWA_algorithm>]\n\nDevelopper: Shaokang Zhang (zskzsk at uga.edu) and Xiangyu Deng (xdeng at uga.edu)\n\nContact email:seqsero at gmail.com')
parser.add_argument("-m", choices=['1','2','3', '4'],help="<int>: '1'(pair-end reads, interleaved),'2'(pair-end reads, seperated),'3'(single-end reads), '4'(assembly)")
parser.add_argument("-i", nargs="+", help="<string>: path/to/input_data")
- parser.add_argument("-b",choices=['sam','mem'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
+ parser.add_argument("-b",choices=['sam','mem','nanopore'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
+ parser.add_argument("-d",help="<string>: output directory name, if not set, the output directory would be 'SeqSero_result_'+time stamp+one random number")
args=parser.parse_args()
dirpath = os.path.abspath(os.path.dirname(os.path.realpath(__file__)))
if len(sys.argv)==1:
@@ -19,7 +20,9 @@ def main():
else:
request_id = time.strftime("%m_%d_%Y_%H_%M_%S", time.localtime())
request_id += str(random.randint(1, 10000000))
- make_dir="SeqSero_result_"+request_id
+ make_dir=args.d
+ if make_dir is None:
+ make_dir="SeqSero_result_"+request_id
os.system("mkdir "+make_dir)
os.system("cp -rf "+dirpath+"/database "+make_dir)
mode_choice=args.m
=====================================
database/FliC_Family_k,z_special_genes.fasta
=====================================
@@ -1,52 +1,50 @@
->fliC_k_Salmonella.enterica_IIIb.42:k:e,n,x,z15_AY353436
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
->fliC_k_Salmonella.enterica_IIIb.61:k:1,5_AY353539
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
->fliC_k_Salmonella.enterica_IIIb.50:k:z_AY353538
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATTCTGCTAAAAGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
->fliC_k_Salmonella.enterica_IIIb.50:k:z53_AY353440
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
->fliC_k_Salmonella.enterica_IIIb.17:k:z_AY353437
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
->fliC_(k)_Salmonella.enterica_IIIb.16:(k):e,n,x,z15_AY353541
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
->fliC_k_Salmonella.enterica_IIIb.65:(k):z_AY353438
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
->fliC_(k)_Salmonella.enterica_IIIb.42:(k):z35_AY353542
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
->fliC_k_Salmonella.enterica_IIIb.38:(k):z53_AY353540
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
->fliC_k_Salmonella.enterica_IIIb.38:(k):z35_AY353439
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
->fliC_z6_Salmonella.enterica_II.48:e,n,x,z15:z6_AY353519
-GATAGCAAAGCTGTAACAGTAGCTGCTAATTTAGATATTACTGATCTTAATAAAGATGCGGCCCTTAAAGCAGGGACTGGTGCTACAACAGGTACTGCAGCAATAAAAGATGACAAAGTTTATTATGATAGTGCTAGCAAAAACTACTACGTTGAAGTTACCGGTCTGACTACCCCTGATGACGGTAAAAATGGCTTCTATAAAGTAAATGTCGCCGATGATGGTAAGGTATCTATGGCCGCTGGTACGGCTATGGAGGCGGGTAAACCAGCTGGTGCGGTAGAAGTAACAAAAACTCAGGAAGAGAAAAATCCATTACCGTTATCAGCAGATCTCAAGACTTCTCTTAAATCTGGCGGGGTTACAGATCCAGAAATTGCTGCTGCCCAAGTT
->fliC_z_Salmonella.enterica_II.16:z:z42_AY353469
-GATAGCAAAGCTGTGACCGGTGTTTCTAATTTGGATACTACAGGTCTTACTGGCGCAGCTATTAAAACTGGCGTTGCTGGAGCTACCACTACGAGTGGTTCCATTAAAAATGACAAAGTATACTATGATGATGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTGCTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACG
->fliC_k_Thompsonstr_AOXP01000022
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
->fliC_k_Thompsonstr_AMSN01000007
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
->fliC_k_Salmonella.enterica_Blockley_AY353442
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
->fliC_z_Indianastr_AOZC01000051
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACGGCAGAAATGGTC
->fliC_z_Salmonella.enterica_Indiana_AY353468
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACG
->fliC_z41_Salmonella.enterica_Maska_AY353511
-GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGTATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATGGCTGGAAATATTGATACTGCTGATGCAGATGCTGCTGAAATGGTCAAAATG
->fliC_z_Salmonella.enterica_II.40:z:z42_AY353470
-GATAGCAAAGCTGTGACCGGTGTTTCTACTTTGGATACTGCAGGACTTACTGGCGCAGCTATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGTTCCATTAAAGATGGCAAAGTATACTTTGATGATGCTACTAAAAATTATTATGTTGAAGTAGAGTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGTACTGTTACAATGGGGGCTTCGACTACTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGTTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACGGCAGAAATG
->fliC_k_Invernessstr_AOZD01000019
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
->fliC_k_Salmonella.enterica_Inverness_AY353441
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
->fliC_z44_Salmonella.enterica_Quinhon_AY353513_k,z
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGACTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTGCTAAAAATTATTATGTTGAAGTAGACTTTTCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGACGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATACTGCTGATGTAGCTACGGCAGAAATG
->fliC_z_Salmonella.enterica_Poona_AY353467
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATGCTGCTGATGTAGCTACG
->fliC_z41_Salmonella.enterica_Ottawa_AY353510
-GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGGATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATTGCTGGAGATATTGATACTGCTGATGCAGATGCTGCTGAAATG
->fliC_z44_Salmonella.enterica_Bulovka_AY353512_k,z
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGGCTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGATGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCAAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAA
->fliC_z69_Salmonella.enterica_Pietersburg_AY353520
-GATAGTAAAGCTGTAACAGTAGCTGCTGATTTAGATATTACCGCTCTTAATACCGATGCAGCTCTTAAAGCAGGAACGGGAGCTACAACAGGTACTCCATCAATAAAAGATGACAAAGTTTATTATGATAGTGCCAGCAAAAACTACTACGTTGAAGTTACCGGATTAACCGCCCCTGATGATGCTAAGAATGGCTTCTATAAAGTAAATGTTGCTGATGACGGTACAGTATCCATGGCCGCTAATACAGCTATAGAGGCGGGTAAACCAGCCGGTGCAGTAGAAGTAACAAAAACTCAAGAAGAAAAAAACCCATTACCATTATCAGCAGATCTCAAAACTTCTCTTAAATCTGGCGAGATTACAGATCCAGACATT
+>fliC_k_Salmonella.enterica_IIIb.42:k:e,n,x,z15_AY353436
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
+>fliC_k_Salmonella.enterica_IIIb.61:k:1,5_AY353539
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
+>fliC_k_Salmonella.enterica_IIIb.50:k:z_AY353538
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATTCTGCTAAAAGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
+>fliC_k_Salmonella.enterica_IIIb.50:k:z53_AY353440
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
+>fliC_k_Salmonella.enterica_IIIb.17:k:z_AY353437
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
+>fliC_(k)_Salmonella.enterica_IIIb.16:(k):e,n,x,z15_AY353541
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
+>fliC_k_Salmonella.enterica_IIIb.65:(k):z_AY353438
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
+>fliC_(k)_Salmonella.enterica_IIIb.42:(k):z35_AY353542
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
+>fliC_k_Salmonella.enterica_IIIb.38:(k):z53_AY353540
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
+>fliC_k_Salmonella.enterica_IIIb.38:(k):z35_AY353439
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
+>fliC_z6_Salmonella.enterica_II.48:e,n,x,z15:z6_AY353519
+GATAGCAAAGCTGTAACAGTAGCTGCTAATTTAGATATTACTGATCTTAATAAAGATGCGGCCCTTAAAGCAGGGACTGGTGCTACAACAGGTACTGCAGCAATAAAAGATGACAAAGTTTATTATGATAGTGCTAGCAAAAACTACTACGTTGAAGTTACCGGTCTGACTACCCCTGATGACGGTAAAAATGGCTTCTATAAAGTAAATGTCGCCGATGATGGTAAGGTATCTATGGCCGCTGGTACGGCTATGGAGGCGGGTAAACCAGCTGGTGCGGTAGAAGTAACAAAAACTCAGGAAGAGAAAAATCCATTACCGTTATCAGCAGATCTCAAGACTTCTCTTAAATCTGGCGGGGTTACAGATCCAGAAATTGCTGCTGCCCAAGTT
+>fliC_z_Salmonella.enterica_II.16:z:z42_AY353469
+GATAGCAAAGCTGTGACCGGTGTTTCTAATTTGGATACTACAGGTCTTACTGGCGCAGCTATTAAAACTGGCGTTGCTGGAGCTACCACTACGAGTGGTTCCATTAAAAATGACAAAGTATACTATGATGATGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTGCTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACG
+>fliC_k_Thompsonstr_AOXP01000022
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
+>fliC_k_Thompsonstr_AMSN01000007
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
+>fliC_k_Salmonella.enterica_Blockley_AY353442
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
+>fliC_z_Indianastr_AOZC01000051
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACGGCAGAAATGGTC
+>fliC_z_Salmonella.enterica_Indiana_AY353468
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACG
+>fliC_z41_Salmonella.enterica_Maska_AY353511
+GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGTATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATGGCTGGAAATATTGATACTGCTGATGCAGATGCTGCTGAAATGGTCAAAATG
+>fliC_z_Salmonella.enterica_II.40:z:z42_AY353470
+GATAGCAAAGCTGTGACCGGTGTTTCTACTTTGGATACTGCAGGACTTACTGGCGCAGCTATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGTTCCATTAAAGATGGCAAAGTATACTTTGATGATGCTACTAAAAATTATTATGTTGAAGTAGAGTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGTACTGTTACAATGGGGGCTTCGACTACTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGTTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACGGCAGAAATG
+>fliC_k_Invernessstr_AOZD01000019
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
+>fliC_k_Salmonella.enterica_Inverness_AY353441
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
+>fliC_z44_Salmonella.enterica_Quinhon_AY353513_k,z
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGACTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTGCTAAAAATTATTATGTTGAAGTAGACTTTTCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGACGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATACTGCTGATGTAGCTACGGCAGAAATG
+>fliC_z_Salmonella.enterica_Poona_AY353467
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATGCTGCTGATGTAGCTACG
+>fliC_z41_Salmonella.enterica_Ottawa_AY353510
+GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGGATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATTGCTGGAGATATTGATACTGCTGATGCAGATGCTGCTGAAATG
+>fliC_z69_Salmonella.enterica_Pietersburg_AY353520
+GATAGTAAAGCTGTAACAGTAGCTGCTGATTTAGATATTACCGCTCTTAATACCGATGCAGCTCTTAAAGCAGGAACGGGAGCTACAACAGGTACTCCATCAATAAAAGATGACAAAGTTTATTATGATAGTGCCAGCAAAAACTACTACGTTGAAGTTACCGGATTAACCGCCCCTGATGATGCTAAGAATGGCTTCTATAAAGTAAATGTTGCTGATGACGGTACAGTATCCATGGCCGCTAATACAGCTATAGAGGCGGGTAAACCAGCCGGTGCAGTAGAAGTAACAAAAACTCAAGAAGAAAAAAACCCATTACCATTATCAGCAGATCTCAAAACTTCTCTTAAATCTGGCGAGATTACAGATCCAGACATT
=====================================
database/FliC_Family_l,v_special_genes.fasta
=====================================
@@ -6,8 +6,6 @@ AATACCACTGGTCTTAATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGG
AGTACCACTGGTCTTGATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAGCGGTACCGCTGCAATTAAGGATGGTAAAGTCTTCTTTGATGCAACTGATAATAAATATTTTATTGAAGTTGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
>fliC_l,z13_Salmonella.enterica_Kenya_AY353449
AGTACCACTGGTCTTGATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAGCGGTACCGCTGCAATTAAGGATGGTAAAGTCTTCTTTGATGCAACTGATAATAAATATTTCATTGAAGTTGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACTACG
->fliC_l,v,z13_Salmonella.enterica_Kimberley_AY353448
-AATACCACTGGTCTTAATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGGTAAAGTCTTCTTCGATGCAACTGATAATAAATATTTTATTGAAGTAGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
>fliC_l,w_Salmonella.enterica_Glidji_AY353447
AATACCGCTGGTCTTAATGATACAGCTCTTAAAGCGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGGTAAAGTCTTCTTCGATGCAACTGATAATAAATATTTTATTGAAGTAGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
>fliC_l,z28_Salmonella.enterica_Javiana_AY353455
=====================================
database/FljB_1_2_7_whole.fasta
=====================================
@@ -1,5 +1,7 @@
>fljB_1,5_Salmonella.enterica_IIIb.61:k:1,5_AY353278
ATGGCACAAGTAATCAACACTAACAGTCTGTCGTTGCTGACCCAGAATAACCTGAACAAATCCCAGTCCGCACTGGGTACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTCACTGCGAACATCAAAGGCCTGACTCAGGCTTCCCGTAACGCTAACGACGGTATTTCTATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCTATCCAGGCTGAAATCACCCAGCGTCTGAACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTTCTGGCGCAGGATAACACCCTGACCATCCAGGTTGGTGCCAATGACGGTGAAACCATCGATATCGATCTGAAGCAGATCAACTCTCAGACTCTGGGTCTGGATACGTTGAATGTGCAAAAAGCGTATGATGTGAAAGATACAGCAGCAACAACGAAAGCTTATGCTGATAATGGTACTACACTGGATGTATCAGGTCTTGATGATGCAGCGATTAAAGCGGCTACGGGTGGTACGACTGGTGCGCCTACTGTAACGGGCGGTGCGGTTAAATTTGACGCAGATAATAACAAGTACTTTGTTACTATTGGTGGCTTTACTGGTGGTGATGCTGCCAAAAATGGCGATTATGAAGTTAACGTTGCTACTGACGGTAAAGTAACACTTGCGACTGGTGCAACTAAAACCACAATGCCTGCAGGTGCTACAACCAAAACAGAAGTACAGGAATTAAAAGATACACCGGCAGTTGTATCAGCTGATGCTAAAAATGCTTTAATTGCTGCTGGCGTTGATACTACAGATGCAAATGCCGCGACATTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAATATTACGCTGCTGATTACAATGAAACTACAGGAGCTATTAAAGCTAAAACCACAAGTTATACTGCTGCTGACGGTACTACTAAAACGGCGGCTAACCAACTTGGTGGCGCAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTATAATGCCAGCAAAGCTGCTGGTCATGATTTCAAAGCACAGCCAGATCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCTGCGCTGGCACAGGTTGACACGTTACGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAATTCCGCCATCACCAACCTGGGCAACACCGTAAACAACCTGACTTCTGCACGTAGCCGTATCGAAGATTCTGACTACGCGACTGAAGTCTCCAACATGTCTCGCGCGCAGATTCTGCAGCAGGCGGGGACTTCCGTTCTGGCGCAGGCTAACCAGGTCCCACAAAACGTGCTGTCTCTGTTACGTTAA
+>fljB_1,5_Muenster_DTU-unknown_another_1,5
+ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAATCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGTCTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTGAACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAGGACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTGAAGCAGATCAACTCTCAGACCCTGGGCCTGGATTCACTGAACGTGCAGAAAGCGTATGATGTGAAAGATACAGCAGTAACCACGAAAACTTATGCCAATAATGGTACTACACTGGATGTATCGGGTCTTGATGATGCAGCCATCAAAGCGGCCATAGGTGGTACGACTGGTACGCCTGCTGTAACGGGCGGTACAGTTAAATTTGACGCAGATAATAATAAGTATTTTGTTTCTATTGGTGGCTATACTGGTGCTGATGCATCCAAAAATGGCGATTATGAAGTTAACGTTGCTGCTGACGGTAAAGTTACACTTGCTACAGGTGCAACTAAAACCACAATACCGGCAGGTGCGACAACTAAAACAGAAGTACAGGAGTTAAAAGATACACCAACAGTTGTTTCAGCAGATGCGAAAAATGCCTTAATCGCTGGCGGCGTGGATGCTACCGATGCTAATGGCGCTGAGTTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAGTATTACGCCGCAGATTACGATGAAGCGACAGGAGCAATTAAAGCTAAAACCACAAGTTATACCGCTGCTGACGGCGCTACCAAAACAGCGGCTAACCAACTGGGTGGCGTAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTACAATGCCAGCAAAGCCGCTGGTCATGATTTCAAAGCACAACCAGAGCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCCGCGCTGGCGCAGGTGGATGCGCTGCGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAACCTGTCTGAAGCGCGTAGCCGTATCGAAGATTCCGACTATGCGACCGAAGTCTCCAACATGTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACTTCCGTTCTGGCGCAGGCTAACCAGGTTCCGCAAAACGTCCTCTCTTTACTGCGTTAA
>fljB_1,7_Salmonella.enterica_Bredeney_AY353296
ATGGCACAAGTAATCAACACTAACAGTCTGTCGCTGCTGACCCAGAATAACCTGAACAAATCCCAGTCCGCACTGGGCACCGCTATCGAGCGTCTGTCTTCTGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGTCTGACTCAGGCCTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTGAACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAGGACAACACCCTGACCATCCAGGTTGGTGCCAACGATGGTGAAACTATCGATATCGATCTGAAGCAGATCAACTCTCAGACCCTGGGTCTGGATTCACTGAACGTGCAGAAAGCGTATGATGTGAAAGATACAGCAGTAACAACGAAAGCTTATGCCAATAATGGTACTACACTGGATGTATCGGGTCTTGATGATGCAGCTATTAAAGCGGCTACGGGTGGTACGAATGGTGCACCTAGTGTAACAGGTAGTGCGGTTAAATTTGACGCAGATAATAACAAGTACTTTGTTACTATTGGTGGCTTTACTGGTGCTGATCTCGACAAAAATGGCGATTATGAAGTTAACGTTGCTACTGACGGTACAGTAACCCTTGCGGCTGGCGCAACTAAAACCACAATGCCTGCTGGTGCGACAACTAAAACAGAAGTACAGGAGTTAAAAGATACACCGGCAGTTGTTTCCGCAGATGCTAAAAATGCCTTAATTGCTGGCGGCGTTGACGCTACCGATGCTAATGGCGCTGAGTTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAGTATTACGCCGCAGATTACGATGAAGCGACAGGAGCAATTAAAGCTAAAACCACAAGTTATACCGCTGCTGACGGCACTACCAAAACAGCGGCTAACCAACTGGGTGGCGTAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTATAATGCCAGCAAAGCCGCTGGTCATGATTTTAAAGCACAGCCAGAGCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCCGCGCTGGCGCAGGTGGATGCGCTGCGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAACCTGTCTGAAGCGCGTAGCCGTATCGAAGATTCTGACTATGCGACCGAAGTTTCCAACATGTCTCGCGCGCAGATCCTGCAGCAGGCCGGTACTTCCGTTCTGGCACAGGCTAACCAGGTCCCGCAGAACGTGCTGTCTCTGTTACGTTAA
>fljB_1,2_Salmonella.enterica_Typhimurium_AY353264
=====================================
database/H_new_fliC_protein_database.fasta
=====================================
@@ -302,8 +302,6 @@ MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTSNIKGLSQASRNANDGISIAQTTEG
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTATLDLDVTDLDTNALKTATGISAGNPAVKDDKVYYDSANNNYYVEVEGFTDNTKDGFYKVQVGDDGKVSMATTTNKETATPPGIVEVSKTHDEKALKASAEVKAALIAGDIDTADADAAEMVKMSYTDKNGKTIDGGYAVKVGDNYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGADGKTEVVSIDGKTYNASKAAGHNFKAQPDLAEAATATTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z41__Salmonella.enterica__Maska__AY353511__k,z
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTATLDLDVTDLDTNALKTATGISAGNPAVKDDKVYYDSANNNYYVEVEGFTDNTKDGFYKVQVGDDGKVSMATTTNKETATPPGIVEVSKTHDEKALKASAEVKAALMAGNIDTADADAAEMVKMSYTDKNGKTIDGGYAVKVGDNYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGVDGKTEVVTIDGKTYNASKAEGHNFKAQPELAEAATATTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
->z44__Salmonella.enterica__Bulovka__AY353512__k,z
-MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDSLNVQKAYDVQATVENSVKLDTSALTADAIKGGVTGATTAGALKDGKVYSNGTDYYVEVSFADAADSGKNGFLKVDVNTTTGAVTVPAAANTVAAKPAGVSEVTEVQGLNTPSSAVQDQLTAAGVSAADAAKSEVVKMSYTDKNGKTIDGGFGIKVGDDIYAATKNKDGSISINATEYTDKDGNTKTALNQLGGVDGKTEVVTIDGKTYNASKAAGHDFKAQPELAEAAAKTTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z44__Salmonella.enterica__Quinhon__AY353513__k,z
MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTGVSTLDTTGLTGTDIKTGVDGATTTSDSIKDGKVYYDGAAKNYYVEVDFSDTAKNGYYKVNVADDGTVTMGASTTKEPAKPAGVVEVTKTQEEKAIKTSAEVKAALTAGGVDTADVATAEMVKMSYTDKNGKTIDGGYAVKVGDSYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGVDGKTEVVTIDGKTYNASKAAGHDFKAQPELAEAAAKTTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
>z47__Salmonella.enterica__IIIb.38:z47:z53__AY353514__other.z47
=====================================
database/special_O_genes.fasta
=====================================
@@ -89,6 +89,8 @@ ATGTCGTACAAAAGTAATAATTTCTATAGAAATATACTTTTATTGAGTTTTTTCTTTTCTGGCTTTAGCTTGTATACTGT
ATGATTGAAGGATATGTAGTATATAATAGTATTTTTCTTCTTGCCTTACTATTTGGCTTTATGAAGAATTACTGTCTTCGGAAATATTTTTTATTATGCTTATTCCTTGTCTTATGGGTTCCACTTGCCACTCGTTATGGCATTGGTCGTGACTATTTTAGCTATGTTGATATTTATAAAAATGTGTTAGTTACCAGAGATGGTATTGAAGTAGGTTTTTATTATCTAAATTATCTGTTGGCATATTTTGGTTTCCATTATCAATCTATATTTATATTGACATCTTTTATTACTGTCTATTTAAGTGTTAAAAGTTTTGATAGAGAATATACAATAGTATCAATTATATTATTTGGGGTTTTGGTTTACTTACAGGCGTTTAGTATTGTTAGGCAAATGCTTGCTGTAGCCTTATGTCTTTATAGCTGTTCGTTATGGAATAAAGGTGTTAAGGTTAAAGCAATTATTTTTCTTATGCTGGCACCTTTGTTTCATTATTCTGCTGTAATAATATTTATATTGGCAATAATTAGCAGATGTGTTAAAATCGATACGTTTAAATGTCTTGCTATGTTAGGGCTTAGCCTTATTTTTGTTTTTGTATTTAATGGGATCGATTTTATATTTTCAAATCCTATACTATTAAATAGTAAGTATGGATATTATGTAACATCAGCCTTTAACAGACCGACTGAAATAGGTTCAGGCATTGGAGTGGCAATAGCATTATTTCTTCCATTCTTGATTTTTATGAAAGCATCAAAAATATATAAACATAATAAAAATTATAATCTGATGCTATTAATAAACCTTGTATATGTTGTTTCATTTGTTTTATCTTTGAAAATATATATATTCGCCAGATTCACTGATGCGCTATCCTTTGTCCTGATATTACTTATCCCTGCTGCTCTTAAAATATCAAATACTAGAGGCCTATATTATAACTGTATGTTATCTGTTGTTATTCTTCACATTATGCTATTTGAAGTAAATCTTAAAGCAAATACAATTGCAGCTGGAGATATGTCTAATAGCGGGCTTGGAATCATGCCGTATAGCAACATAATAAACGCACATATGCTAAAATACTAG
>O_48_wzy
GTGATTATAAAGAAGAATAAATTTGTTTATTCGGTACTTAAAGTCTGGTTAATAGTCTCTTCATTGTATTATTTAAATGCTATTTTTTCCGGTGTTGATGCGTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAATATGTTTTATAATAAGTTTTTTTATTCTGTTCAATAGTAAACGAGTCAAATTTTTGGGGGCTTCGTTATTTTTCATAATCCTTTCGGTAGCTTCAGTAGTTATTGGTAATGTAGTAACGGTATATGCTACCGCGATGCTGATAATTGCTACCATGGTTGGTTTCAGCCAAATTATTCTTTATTTTTCTAATGATATGTCGAAGATTAATATGGTTTTATTATGGACTGGAATTATAATAGGCGCCATTTCTGTATTAGAATTAACAGTATTCTACGATTATATGGTCTCATATTGGGTTTCGACTGGTGGAGTCCGATCAATATCTTCTCTTCTTAATCCTACAAATAGCGGGGCTTATTCAGCGATTATAATTTTAATTGCTTTAGGGACTAATATAAGGAGTAAATTTAAGAGAACTTTATTTGCTTTAATGCCAATGATTACTTTAATCAGCAGCGGATCACGTACAGCATGGTTATCATTAGCATTAACATTATTATTGACGGTATTATTAAATGATAAGGCTAGTATACGATTACGGAAAAAAATATTAGCTATTGCAGGTATTGGAGCTATTTGTGGTGTGTTATATGTAGCATTTTATATGAGTAGTATCTCTGGTATTCAATCCCAACATCGAGGGCTTGATACATATACCGCATCAATTCGAGTTGAAAACTTTATAACATATATGAATTCAATTGATTTTGATATGTTATTACCTGATTTCCTTGATAAAAATATTAACCTTATATCAGATAATTTTTATCTAGTGTTATTAAATTATTTTGGAATTATTGGGGGTTATATTGTTTTTTTTATTTCAGTATTATTATTCTATTATAATATGCAAACAAAGGATTTTGATAAAAATATAGATGAAAGTATTTCTGTTTGGAGAGTGATATTCATCTATTTTCTGATATCTGGACTTTCAAACTCATTCATAAATTCTTTTCCTGTAAACCAACTATTTTTTATCTCATGCGGGTATTATGTGTATAAATATAACTTAATAAAGAAAAATGCTGGAAAGCAAATATGA
+>O_48_unknown-from-cdc-new-genomes-sequence
+CTGCAGCAAGCTCCTGAAGCTTATCCCCACCTTGAGCACCAAATTTCCAATTTTGTAAAATGTTACTCTTAAAGTTGCTACAATAATCACACTCTCCACTATTATCAAAAACTATGTTAGGATCAGATGTATCCATAATACAATGGCTACAAACTTTATAACTTTGATTTTCCATGTTCCCCCCTATTTAAAATGACTTTCATAACAATTTCATTAATTTCTTCTGTTTGTACTACATGTAATCCATGAAATAACACTAGTGTTCCCATTTCTTCATATTTATATGCAAGAGTTGATGGATATGAGATAACTACATCAACCTTAGGAAAAAAGTTATCGTCTATAATAAAATTGAATTTAAATTGCCTGACTTTTGAGGAAGCTCTTGCCTTAGGATGCTCTTTATAATAAATAGAACAATTTTCAATTTGTTGATTAATTAGAGAGCAAATTTTTAGCTGACCTTTCTCACACAATGAATGCCCAATAACTAACAATGTTAGCTGGTTCGATGATACTTGAGTAAGGGACAACATAGGTTTACTATATTCCACCTTTATAATTTCGGCCAAATTATAATCCAGTATGTTGTTTATAAACAATTGAAATTCAACTTCATCGAAAACAATTATTTTATCCAAATGCTTTAATTTATATGGTATCTTAAAAAGTAAATAGGCACTTGAATCAAGGGCTCTCAAAGATCCATGCTGGATAAGAGTATATTGAATTCCTTTTTCTCCTAACATTGAATCAATCAGGACCGCCCAACGATCATAATGTTCACTACTTATAACCTTTCCTTGTATTCTATTCATCACTAATGCGACAAGGAACCAAGATGGAGCTGTGTATATTTGCAGGCACCATTTGATAGTATGCTTCGATTTAAAAAAATAGAAAAACGCAAATATGCTTAGCAACATGCTTTTGAAAATATCTAAATACGAAGCCATCTCATAAATTGAAATAACTGTAGCATCACTTCTATCATTACACGATGATAATTTAATAACATTTAACTTTTTTCCATCCGAAATTTTACTATTATAATAATTAATTGCTTGCTCCGTACCTATTTCAGCGAATGAAAAATAGTAAAAGTCGCTTCTATCAATCAATTTATTTTTATCTGTAATTATTTTTTTGTATAATGCAACTATACATTTTAATATAGGATAAAATATAAACCCCCCTAATATGAAGAAAATCATAAGAGAGATATATCCCCCCCACAATTTATGCCTCCCATATGCCCATTTGCTGATCCGAGGTAATGGTGGTATTCTACCTTTCATGCCAGCGATCAACAATTTATCAATAGAGATTTCATTTTCCGTAGCTAACATATAGTAGCGTAAATATGTTTTATAAGAAATTCTCATCCGACATGCCCGTCATTAATAATATGTAGACGCTCTAATTAATAATCAATTATTGACTTTTTTAGAGATATTTGTAACTAGTTAACATGAAAAATTCATATAAAAATGCTAAGTCATCTTCTTATTTATATTTTTCTTGTTGACTAAATAAATTATCGATATAAAAATCATAACTGCTGACGGTGTAAAATACCCAGAACCTCTTAGCAAAAAATATATTATGCTCATTATTAAAACTATACTAAAAAACTTTATTTTTTTGTCATTGCATTTAAACCGCATGACACCTAAAAATAATGTATAAAGAAAAAAAATGCCCCCTAAGATACCAAATTCAACAATCAATTTAGAAATAAATAGTCCACCATCATATAAGTTAGAATCTGTATTCCCTCCCCTTAACCGCCCAATGATTGATACAAACTCTCCTCTTTCATTTGCATATCCCATATTTTGTAAACCATAACCAAGGCCATAGCTATCTCGCAACGCTAGATATGCTTGTTCATATCCAGATAATAAAGTTAATGTTGATGTATTTTTCGATTCTTGGCTTATATCTAATCGTTGCGAATAATAACTTAGTTTATCAATAGGTAAGATTCCAGCAATCAGCATACACGATGAAGATACGCAAATCATAATAATGAACATTGATTTAACTCTCATATAGTTTATAGCTATCGCTACAACAATACCTATAATCAATGTTAAATTCTGGACAATAAGAGCCGTAAATAAAAGAGGAATTCCATAGAGCAAATTTAATTTTTTCTGAGATATCTTATAGCAATAAAAGATTGTAACTATTAGTGCATAATGAGAGGGCTCAGTAAAAAACAACATTTCCTTTGAAGTGCTACTGCTTGATAATATAAAAAGAGATGACAATACCCCCAAAGCTATTAGTAATTTAAATAATTTTGATACTATTCTATCAAACTCCTGGTGAGTAATATTATCAATTGCCACCGATGAAAAATAACATGCGAGTAAAATATAAAATAAGAATAACAATGATGTAATATTCTTAGTGAAAGTAGTATTACCATTCTGAAATAGTAGACTACTTAACCCAAAATGAAACAATATTAGAAAAAAACTAATAACACTAAAAATTAAAAATGAATAACTTATAGTTAATTTATTAAAGCCAGAAATAACCACTAAAAATAATATTATAGTTGATATAAAGAAAATACCAATGAAATTCGAACCAACTTTATCATTTAACACCATTAACAGGCCTGGAACCAGCACCATTCCATAAAAAAATATTGAGGTCAGAACTTTATTAGTATTAAATTGCATTATAGTTAAACCTTATTATTCCTTTTAATTACAATAAAAAATTATATAGCATAAGTATTTTAATTTAAAACAATTAAACTTTTCGTACTTTTCGTAGTTCATGCTTTTAATAATAAACTATGTATCTCACCGAGAAATTCGCTATAACAAACGTAACACTATGCATTTTATATCTATATAAAATACAATAGGTAAGATATCATCTATTAGAATAAAATAAACTCTCGCCGGCAGATCGTCTAATTATAACCAAGAGTTTTATAAACATAGCCAGCTTTAAAAATAATAAAACTGAAAAAGAAATAATCATACCATAAGCAATGTAATTAATATTCGCGACCTTAAGTGCAATATAAAGAAAAGATGAAAACAGTAAAAAAGTTAAACACTGGCTCCAGACTATCATTTTATCTTTTCTTAGTGCATACAGACCCAGATGTGGTATAAGGCTTAAACAATATATAAACGTCGCCACAATTAGCAACTGAAATAGTGGAAGTAATTCCCAATATTCGATCTTTCCAATCCACTGAATGAGGATATAACCGGTAAAAAAACAACAAATACATAACAGAAGCGACACTGCTATTAATTTGAATGCGAATGACTTCATTCCAGCGATGAATCCAATGTAGTCCTTTCGATAACACAATTTTGCCAATTTTGGGAATGAAAAAGATATTAGGATCGTATCGAGGAAAGATTGTATAGCCGCCGTCATACTAATAAACAAAGTATATACACCAAGGATCTTTAGTCCAGCAATATGTTCAACGGCAAACCTATCAAATGTAAAAAAACCTCTGAGCGCCAAAGCGGCAATTAGCATTGGTGCGGAAAGGATAATTCCTCTCATTATCCAGCGCCAGCTAAATGGCGATGTAAACTTCCGTTTATTATTTTTTAGAATATAAAAAAAGCCCATTGCACTAGCACAGAATGTACCAAATAGCCATAATGTAAATACAATAAATAGATTTCTTGACGTAGGAAATAATAGCATAATGGCTATCACGAGCCAGCACCAAAGTCCTTGTCGTATAAACAACACAAGACTTGCGAAAGCTTGATTCTCGAGAGTTATTAATATTCTATTAATTTCTTGAGCTATATGTTCAAAAAAGAGAATAGCAAGAAACCAGTACTCACTTCCGTGGGGAAGAAAGGAATAATGTTGGATAACAATAAAAATGGGGATATAAAATATATATGATAATACATAAAAAAATGACTGATTTTTTAAAATAAAAAAAAGATCGTCACTTTTTGAGTTTATTATCTCTCTAGTACTATAAGTATAAAATTCAAATCCAATAGCAAAAATTGCGTAGCCCACAGCGGCGCTTATAAGACCATAGACTCCCAAATCTGATGATTGCAACAATTTTGCTAATAAAATTATAAACACAAACTTGCTTATCAAAGTAAAGCCACGTATACCTATACTTAAATAATATATAAAAAGAGATTTTTTCATTTGAATAAGCCAATAATGCTTAAAAATATCGTTAACATAATATTAAAAATAGGCCATATACTAATAGATAGCTTTTTAGAAGTTTACAGATCATAGAATGCTTTGAAGCCTAGATTAGCAGGATCATTTGATAAAAATGCTTTAATTATATCCACAATTCTATCTTTTACATTTTCCATAAAATATGGGTTTTTAGAGCTTTCTAGCTTAGAAATAAAAACTTTATCAGTCACACTCGAAATAGCTTCACGTATAGCATTTTTTTCACAAATAGTATCGACAACGCTTTCACCACGAATGCGCC
>O_4_wzx
GTGAAAGTTCAATTGTTAAAAATTCCGAGTCATTTAATTGTTGCAGGTTCATCATGGTTATCCAAAATAATAATTGCCGGGGTGCAGTTAGCAAGTATTTCATATCTTATTTCTATGCTAGGTGAAGAGAAATATGCAATCTTTAGTTTGTTAACTGGTTTATTAGTATGGTGTAGCGCTGTTGATTTTGGCATAGGTACAGGACTGCAAAATTATATATCAGAATGCAGAGCCAAAAACAAAAGTTATGATGCATATATTAAATCAGCATTACATCTAAGCTTTATAGCTATTATTTTTTTTATTGCTTTATTTTATATTTTTTCTGGGGTAATTTCCGCTAAATATCTTTCTTCTTTTCATGAGGTATTACAGGACAAAACCAGAATGCTCTTTTTTACCTCATGTCTGGTTTTCAGTTCTATTGGAATCGGAGCTATTGCTTATAAAATACTTTTTGCCGAATTGGTCGGGTGGAAAGCTAATCTATTAAACGCATTATCTTATATGATAGGTATGCTCGGCTTGCTATATATATACTATAGGGGGATCTCAGTTGACATAAAATTATCACTAATAGTCCTGTATCTTCCAGTGGGTATGATTTCATTGTGCTATATTGTATATAGATACATAAAGCTTTATCATGTTAAAACAACAAAATCTCATTATATAGCAATTTTACGTAGATCTTCAGGGTTTTTTCTTTTTACTTTATTATCGATAGTGGTGCTTCAAACAGATTATATGGTCATTTCTCAAAGGCTAACTCCTGCTGATATTGTTCAATATACAGTAACGATGAAAATTTTTGGTTTAGTCTTTTTTATTTATACTGCTATTTTGCAAGCATTATGGCCTATATGTGCTGAATTGAGAGTCAAACAGCAATGGAAAAAACTTAACAAAATGATAGGTGTCAATATTTTGCTTGGCTCACTATATGTTGTTGGATGTACAATATTTATTTATTTATTTAAAGAACAGATATTTTCAGTAATAGCCAAAGATATTAATTATCAAGTTTCTATTTTATCTTTTATGTTAATTGGCATATATTTCTGTATTCGCGTTTGGTGTGACACTTATGCAATGTTATTGCAAAGTATGAATTATTTAAAAATACTTTGGATATTAGTACCACTACAAGCAATAATTGGTGGAATAGCACAATGGTATTTTTCTAGTACGCTTGGAATCAGTGGAGTGCTGCTTGGCTTGATTATATCTTTTGCTTTAACTGTTTTTTGGGGGCTTCCACTAACTTACTTAATTAAGGCAAATAAGGGATAA
>O_50_wzy
=====================================
database/special_new_O_genes.fasta
=====================================
@@ -104,6 +104,8 @@ ATGATTGAAGGATATGTAGTATATAATAGTATTTTTCTTCTTGCCTTACTATTTGGCTTTATGAAGAATTACTGTCTTCG
GTGATTATAAAGAAGAATAAATTTGTTTATTCGGTACTTAAAGTCTGGTTAATAGTCTCTTCATTGTATTATTTAAATGCTATTTTTTCCGGTGTTGATGCGTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAATATGTTTTATAATAAGTTTTTTTATTCTGTTCAATAGTAAACGAGTCAAATTTTTGGGGGCTTCGTTATTTTTCATAATCCTTTCGGTAGCTTCAGTAGTTATTGGTAATGTAGTAACGGTATATGCTACCGCGATGCTGATAATTGCTACCATGGTTGGTTTCAGCCAAATTATTCTTTATTTTTCTAATGATATGTCGAAGATTAATATGGTTTTATTATGGACTGGAATTATAATAGGCGCCATTTCTGTATTAGAATTAACAGTATTCTACGATTATATGGTCTCATATTGGGTTTCGACTGGTGGAGTCCGATCAATATCTTCTCTTCTTAATCCTACAAATAGCGGGGCTTATTCAGCGATTATAATTTTAATTGCTTTAGGGACTAATATAAGGAGTAAATTTAAGAGAACTTTATTTGCTTTAATGCCAATGATTACTTTAATCAGCAGCGGATCACGTACAGCATGGTTATCATTAGCATTAACATTATTATTGACGGTATTATTAAATGATAAGGCTAGTATACGATTACGGAAAAAAATATTAGCTATTGCAGGTATTGGAGCTATTTGTGGTGTGTTATATGTAGCATTTTATATGAGTAGTATCTCTGGTATTCAATCCCAACATCGAGGGCTTGATACATATACCGCATCAATTCGAGTTGAAAACTTTATAACATATATGAATTCAATTGATTTTGATATGTTATTACCTGATTTCCTTGATAAAAATATTAACCTTATATCAGATAATTTTTATCTAGTGTTATTAAATTATTTTGGAATTATTGGGGGTTATATTGTTTTTTTTATTTCAGTATTATTATTCTATTATAATATGCAAACAAAGGATTTTGATAAAAATATAGATGAAAGTATTTCTGTTTGGAGAGTGATATTCATCTATTTTCTGATATCTGGACTTTCAAACTCATTCATAAATTCTTTTCCTGTAAACCAACTATTTTTTATCTCATGCGGGTATTATGTGTATAAATATAACTTAATAAAGAAAAATGCTGGAAAGCAAATATGA
>O-48_wzy-from-blake-2014K-0232
GTGATAATAAAAAAGTACAAAATTTTTTATTCAGCACTTAAAGTCTGGTTAATAGCCTCTTCATTGTATTATTTAAATGCTATTTTTTTAGGTGTTGATGCTTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAGTTTGTTTCATCATAAGCATCTATATTCTGATCAATAATAAACGAGTCAAATATCTGTGGGCTTCATTTTTTTTCATAATTCTTTCTGTAGCTTCAGTAGTTATTGATAGTGTTGTAACGGTATATGCAACCACGATGTTGATAATTGCTACCATGCTTGGTTTTAGCCAAATCATTGTTTATTTATCCAATGATATGTCGAGAATTAATATTGTTTTATTATGGACAGGTGTTATTGTAGGCACAATTTCTGTGTTAGAGCTGACTGTGTTCTACGATTATATGGTTTCATATTGGATTTCGACTGGCGGAATTCGATCAATATCTTCCCTTCTGAATCCTACAAATAGTGGAGCTTACTCAGCGATCATAATTTTAATTGCTTTAGCGACTAATATAAAGAATAAGTTTAGGAAAAGTTTATTTGTTTTAATGCCAATGATTACTTTAATCAGTAGTGGATCACGCACCGCATGGTTATCATTAGCATTAACATTGTTATTGACAGTATTGTTAAATGATAAGGCTAGCATACGATTACGGAAAAAAATATTAGCTGTTGCAGGTATTGGAGCTATTTGTGGTCTATTATATGTAGTATTTTATATGAATGCTACCTCTAGCATTCAATCTCAATATCGAGGACTTGATACATATACCGCATCAATTCGGATTGAAAACTTTATATCGTATATAAATTCAATTGATCTTTGCATGTTATTTCCTGATTTTTTTGACAAAAATATTATTCTTATATCAGATAATTTTTACCTTGTTTTATTAAATTATTTTGGGATTATTGGTTTTTATATTATTCTCTTAATGTCAATGTTGCTATTCTATTGTAATGTACAGATAAAGGATTTTAATGATATTATAAATGAAGATATTGCTATTTGGAGAGTAATCTTTATCTATTTTTTGATATCTGGTTTTTCAAACTCATTTATAAGTTCTTTTCCTGTAAACCAGCTATTCTTTATCTCATGCGGGTATTATGTGTATAAATATAAGTTAATAAAAGAAAATGTTGGAAAGTAAATATGA
+>O-48_unknown-from-serveral-cdc-new-genomes
+CTGCAGCAAGCTCCTGAAGCTTATCCCCACCTTGAGCACCAAATTTCCAATTTTGTAAAATGTTACTCTTAAAGTTGCTACAATAATCACACTCTCCACTATTATCAAAAACTATGTTAGGATCAGATGTATCCATAATACAATGGCTACAAACTTTATAACTTTGATTTTCCATGTTCCCCCCTATTTAAAATGACTTTCATAACAATTTCATTAATTTCTTCTGTTTGTACTACATGTAATCCATGAAATAACACTAGTGTTCCCATTTCTTCATATTTATATGCAAGAGTTGATGGATATGAGATAACTACATCAACCTTAGGAAAAAAGTTATCGTCTATAATAAAATTGAATTTAAATTGCCTGACTTTTGAGGAAGCTCTTGCCTTAGGATGCTCTTTATAATAAATAGAACAATTTTCAATTTGTTGATTAATTAGAGAGCAAATTTTTAGCTGACCTTTCTCACACAATGAATGCCCAATAACTAACAATGTTAGCTGGTTCGATGATACTTGAGTAAGGGACAACATAGGTTTACTATATTCCACCTTTATAATTTCGGCCAAATTATAATCCAGTATGTTGTTTATAAACAATTGAAATTCAACTTCATCGAAAACAATTATTTTATCCAAATGCTTTAATTTATATGGTATCTTAAAAAGTAAATAGGCACTTGAATCAAGGGCTCTCAAAGATCCATGCTGGATAAGAGTATATTGAATTCCTTTTTCTCCTAACATTGAATCAATCAGGACCGCCCAACGATCATAATGTTCACTACTTATAACCTTTCCTTGTATTCTATTCATCACTAATGCGACAAGGAACCAAGATGGAGCTGTGTATATTTGCAGGCACCATTTGATAGTATGCTTCGATTTAAAAAAATAGAAAAACGCAAATATGCTTAGCAACATGCTTTTGAAAATATCTAAATACGAAGCCATCTCATAAATTGAAATAACTGTAGCATCACTTCTATCATTACACGATGATAATTTAATAACATTTAACTTTTTTCCATCCGAAATTTTACTATTATAATAATTAATTGCTTGCTCCGTACCTATTTCAGCGAATGAAAAATAGTAAAAGTCGCTTCTATCAATCAATTTATTTTTATCTGTAATTATTTTTTTGTATAATGCAACTATACATTTTAATATAGGATAAAATATAAACCCCCCTAATATGAAGAAAATCATAAGAGAGATATATCCCCCCCACAATTTATGCCTCCCATATGCCCATTTGCTGATCCGAGGTAATGGTGGTATTCTACCTTTCATGCCAGCGATCAACAATTTATCAATAGAGATTTCATTTTCCGTAGCTAACATATAGTAGCGTAAATATGTTTTATAAGAAATTCTCATCCGACATGCCCGTCATTAATAATATGTAGACGCTCTAATTAATAATCAATTATTGACTTTTTTAGAGATATTTGTAACTAGTTAACATGAAAAATTCATATAAAAATGCTAAGTCATCTTCTTATTTATATTTTTCTTGTTGACTAAATAAATTATCGATATAAAAATCATAACTGCTGACGGTGTAAAATACCCAGAACCTCTTAGCAAAAAATATATTATGCTCATTATTAAAACTATACTAAAAAACTTTATTTTTTTGTCATTGCATTTAAACCGCATGACACCTAAAAATAATGTATAAAGAAAAAAAATGCCCCCTAAGATACCAAATTCAACAATCAATTTAGAAATAAATAGTCCACCATCATATAAGTTAGAATCTGTATTCCCTCCCCTTAACCGCCCAATGATTGATACAAACTCTCCTCTTTCATTTGCATATCCCATATTTTGTAAACCATAACCAAGGCCATAGCTATCTCGCAACGCTAGATATGCTTGTTCATATCCAGATAATAAAGTTAATGTTGATGTATTTTTCGATTCTTGGCTTATATCTAATCGTTGCGAATAATAACTTAGTTTATCAATAGGTAAGATTCCAGCAATCAGCATACACGATGAAGATACGCAAATCATAATAATGAACATTGATTTAACTCTCATATAGTTTATAGCTATCGCTACAACAATACCTATAATCAATGTTAAATTCTGGACAATAAGAGCCGTAAATAAAAGAGGAATTCCATAGAGCAAATTTAATTTTTTCTGAGATATCTTATAGCAATAAAAGATTGTAACTATTAGTGCATAATGAGAGGGCTCAGTAAAAAACAACATTTCCTTTGAAGTGCTACTGCTTGATAATATAAAAAGAGATGACAATACCCCCAAAGCTATTAGTAATTTAAATAATTTTGATACTATTCTATCAAACTCCTGGTGAGTAATATTATCAATTGCCACCGATGAAAAATAACATGCGAGTAAAATATAAAATAAGAATAACAATGATGTAATATTCTTAGTGAAAGTAGTATTACCATTCTGAAATAGTAGACTACTTAACCCAAAATGAAACAATATTAGAAAAAAACTAATAACACTAAAAATTAAAAATGAATAACTTATAGTTAATTTATTAAAGCCAGAAATAACCACTAAAAATAATATTATAGTTGATATAAAGAAAATACCAATGAAATTCGAACCAACTTTATCATTTAACACCATTAACAGGCCTGGAACCAGCACCATTCCATAAAAAAATATTGAGGTCAGAACTTTATTAGTATTAAATTGCATTATAGTTAAACCTTATTATTCCTTTTAATTACAATAAAAAATTATATAGCATAAGTATTTTAATTTAAAACAATTAAACTTTTCGTACTTTTCGTAGTTCATGCTTTTAATAATAAACTATGTATCTCACCGAGAAATTCGCTATAACAAACGTAACACTATGCATTTTATATCTATATAAAATACAATAGGTAAGATATCATCTATTAGAATAAAATAAACTCTCGCCGGCAGATCGTCTAATTATAACCAAGAGTTTTATAAACATAGCCAGCTTTAAAAATAATAAAACTGAAAAAGAAATAATCATACCATAAGCAATGTAATTAATATTCGCGACCTTAAGTGCAATATAAAGAAAAGATGAAAACAGTAAAAAAGTTAAACACTGGCTCCAGACTATCATTTTATCTTTTCTTAGTGCATACAGACCCAGATGTGGTATAAGGCTTAAACAATATATAAACGTCGCCACAATTAGCAACTGAAATAGTGGAAGTAATTCCCAATATTCGATCTTTCCAATCCACTGAATGAGGATATAACCGGTAAAAAAACAACAAATACATAACAGAAGCGACACTGCTATTAATTTGAATGCGAATGACTTCATTCCAGCGATGAATCCAATGTAGTCCTTTCGATAACACAATTTTGCCAATTTTGGGAATGAAAAAGATATTAGGATCGTATCGAGGAAAGATTGTATAGCCGCCGTCATACTAATAAACAAAGTATATACACCAAGGATCTTTAGTCCAGCAATATGTTCAACGGCAAACCTATCAAATGTAAAAAAACCTCTGAGCGCCAAAGCGGCAATTAGCATTGGTGCGGAAAGGATAATTCCTCTCATTATCCAGCGCCAGCTAAATGGCGATGTAAACTTCCGTTTATTATTTTTTAGAATATAAAAAAAGCCCATTGCACTAGCACAGAATGTACCAAATAGCCATAATGTAAATACAATAAATAGATTTCTTGACGTAGGAAATAATAGCATAATGGCTATCACGAGCCAGCACCAAAGTCCTTGTCGTATAAACAACACAAGACTTGCGAAAGCTTGATTCTCGAGAGTTATTAATATTCTATTAATTTCTTGAGCTATATGTTCAAAAAAGAGAATAGCAAGAAACCAGTACTCACTTCCGTGGGGAAGAAAGGAATAATGTTGGATAACAATAAAAATGGGGATATAAAATATATATGATAATACATAAAAAAATGACTGATTTTTTAAAATAAAAAAAAGATCGTCACTTTTTGAGTTTATTATCTCTCTAGTACTATAAGTATAAAATTCAAATCCAATAGCAAAAATTGCGTAGCCCACAGCGGCGCTTATAAGACCATAGACTCCCAAATCTGATGATTGCAACAATTTTGCTAATAAAATTATAAACACAAACTTGCTTATCAAAGTAAAGCCACGTATACCTATACTTAAATAATATATAAAAAGAGATTTTTTCATTTGAATAAGCCAATAATGCTTAAAAATATCGTTAACATAATATTAAAAATAGGCCATATACTAATAGATAGCTTTTTAGAAGTTTACAGATCATAGAATGCTTTGAAGCCTAGATTAGCAGGATCATTTGATAAAAATGCTTTAATTATATCCACAATTCTATCTTTTACATTTTCCATAAAATATGGGTTTTTAGAGCTTTCTAGCTTAGAAATAAAAACTTTATCAGTCACACTCGAAATAGCTTCACGTATAGCATTTTTTTCACAAATAGTATCGACAACGCTTTCACCACGAATGCGCC
>O-4_wzx
GTGAAAGTTCAATTGTTAAAAATTCCGAGTCATTTAATTGTTGCAGGTTCATCATGGTTATCCAAAATAATAATTGCCGGGGTGCAGTTAGCAAGTATTTCATATCTTATTTCTATGCTAGGTGAAGAGAAATATGCAATCTTTAGTTTGTTAACTGGTTTATTAGTATGGTGTAGCGCTGTTGATTTTGGCATAGGTACAGGACTGCAAAATTATATATCAGAATGCAGAGCCAAAAACAAAAGTTATGATGCATATATTAAATCAGCATTACATCTAAGCTTTATAGCTATTATTTTTTTTATTGCTTTATTTTATATTTTTTCTGGGGTAATTTCCGCTAAATATCTTTCTTCTTTTCATGAGGTATTACAGGACAAAACCAGAATGCTCTTTTTTACCTCATGTCTGGTTTTCAGTTCTATTGGAATCGGAGCTATTGCTTATAAAATACTTTTTGCCGAATTGGTCGGGTGGAAAGCTAATCTATTAAACGCATTATCTTATATGATAGGTATGCTCGGCTTGCTATATATATACTATAGGGGGATCTCAGTTGACATAAAATTATCACTAATAGTCCTGTATCTTCCAGTGGGTATGATTTCATTGTGCTATATTGTATATAGATACATAAAGCTTTATCATGTTAAAACAACAAAATCTCATTATATAGCAATTTTACGTAGATCTTCAGGGTTTTTTCTTTTTACTTTATTATCGATAGTGGTGCTTCAAACAGATTATATGGTCATTTCTCAAAGGCTAACTCCTGCTGATATTGTTCAATATACAGTAACGATGAAAATTTTTGGTTTAGTCTTTTTTATTTATACTGCTATTTTGCAAGCATTATGGCCTATATGTGCTGAATTGAGAGTCAAACAGCAATGGAAAAAACTTAACAAAATGATAGGTGTCAATATTTTGCTTGGCTCACTATATGTTGTTGGATGTACAATATTTATTTATTTATTTAAAGAACAGATATTTTCAGTAATAGCCAAAGATATTAATTATCAAGTTTCTATTTTATCTTTTATGTTAATTGGCATATATTTCTGTATTCGCGTTTGGTGTGACACTTATGCAATGTTATTGCAAAGTATGAATTATTTAAAAATACTTTGGATATTAGTACCACTACAAGCAATAATTGGTGGAATAGCACAATGGTATTTTTCTAGTACGCTTGGAATCAGTGGAGTGCTGCTTGGCTTGATTATATCTTTTGCTTTAACTGTTTTTTGGGGGCTTCCACTAACTTACTTAATTAAGGCAAATAAGGGATAA
>O-50_wzy
=====================================
libs/BWA_analysis_H_update_new_family_dependent.py
=====================================
@@ -72,12 +72,16 @@ def BWA_analysis(sra_name,additional_file,database,mapping_mode,file_mode,z):
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
+ elif mapping_mode=="nanopore":
+ os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
else:
if mapping_mode=="mem":
os.system("bwa mem database/"+database+" "+for_fq+" > "+sam) #2014/12/23
elif mapping_mode=="sam":
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
+ elif mapping_mode=="nanopore":
+ os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
file=open(sam,"r")
@@ -376,12 +380,16 @@ def assembly(type,sra_name,for_fq,rev_fq,for_sai,rev_sai,sam,bam,database,databa
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
+ elif mapping_mode=="nanopore":
+ os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
else:
if mapping_mode=="mem":
os.system("bwa mem database/"+database+" "+for_fq+" > "+sam) #2014/12/23
elif mapping_mode=="sam":
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
+ elif mapping_mode=="nanopore":
+ os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
=====================================
libs/BWA_analysis_O_new_dependent.py
=====================================
@@ -93,12 +93,16 @@ def BWA_O_analysis(sra_name,additional_file,database,mapping_mode,file_mode):
os.system("bwa sampe "+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
elif mapping_mode=="mem":
os.system("bwa mem "+database+" "+for_fq+" "+rev_fq+" > "+sam) #2014/12/23
+ elif mapping_mode=="nanopore": ##
+ os.system("bwa mem -x ont2d "+database+" "+for_fq+" "+rev_fq+" > "+sam)##
else:
if mapping_mode=="mem":
os.system("bwa mem "+database+" "+for_fq+" > "+sam) #2014/12/23
elif mapping_mode=="sam":
os.system("bwa aln "+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse "+database+" "+for_sai+" "+for_fq+" > "+sam)
+ elif mapping_mode=="nanopore":##
+ os.system("bwa mem -x ont2d "+database+" "+for_fq+" > "+sam)##
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
@@ -150,6 +154,7 @@ def BWA_O_analysis(sra_name,additional_file,database,mapping_mode,file_mode):
if "sdf" in x[0] and x[1]>3:#
qq=0#
print "$$$",x[0],"got a hit, reads:",x[1]#
+ final_O.remove(x)
if qq!=0:#
print "$$$No sdf exists"#
@@ -194,6 +199,8 @@ def assembly(sra_name,potential_choice,for_fq,rev_fq,for_sai,rev_sai,sam,bam,map
elif mapping_mode=="sam":
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
+ elif mapping_mode=="nanopore":##
+ os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)##
else:
if mapping_mode=="mem":
os.system("bwa mem database/"+database+" "+for_fq+" "+rev_fq+" > "+sam) #2014/12/23
@@ -201,6 +208,8 @@ def assembly(sra_name,potential_choice,for_fq,rev_fq,for_sai,rev_sai,sam,bam,map
os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
+ elif mapping_mode=="nanopore":
+ os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
os.system("samtools view -h -o "+sam+" "+bam)
os.system("cat "+sam+"|awk '{if ($5>0) {print $10}}'>"+sam+"_seq.txt")
=====================================
libs/split_interleaved_fastq.pl
=====================================
View it on GitLab: https://salsa.debian.org/med-team/seqsero/commit/38260da97f64fa5c2994582cbc479aa2f8ec5f34
--
View it on GitLab: https://salsa.debian.org/med-team/seqsero/commit/38260da97f64fa5c2994582cbc479aa2f8ec5f34
You're receiving this email because of your account on salsa.debian.org.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://alioth-lists.debian.net/pipermail/debian-med-commit/attachments/20180903/c9db533d/attachment-0001.html>
More information about the debian-med-commit
mailing list