[med-svn] [Git][med-team/seqsero][upstream] New upstream version 1.0.1+dfsg

Andreas Tille gitlab at salsa.debian.org
Mon Sep 3 18:35:37 BST 2018


Andreas Tille pushed to branch upstream at Debian Med / seqsero


Commits:
38260da9 by Andreas Tille at 2018-09-03T17:31:55Z
New upstream version 1.0.1+dfsg
- - - - -


11 changed files:

- README.md
- SeqSero.py
- database/FliC_Family_k,z_special_genes.fasta
- database/FliC_Family_l,v_special_genes.fasta
- database/FljB_1_2_7_whole.fasta
- database/H_new_fliC_protein_database.fasta
- database/special_O_genes.fasta
- database/special_new_O_genes.fasta
- libs/BWA_analysis_H_update_new_family_dependent.py
- libs/BWA_analysis_O_new_dependent.py
- libs/split_interleaved_fastq.pl


Changes:

=====================================
README.md
=====================================
@@ -1,4 +1,4 @@
-# SeqSero 1.0
+# SeqSero
 Salmonella serotyping from genome sequencing data
 
 


=====================================
SeqSero.py
=====================================
@@ -11,7 +11,8 @@ def main():
   parser = argparse.ArgumentParser(usage='SeqSero.py -m <data_type> -i <input_data> [-b <BWA_algorithm>]\n\nDevelopper: Shaokang Zhang (zskzsk at uga.edu) and Xiangyu Deng (xdeng at uga.edu)\n\nContact email:seqsero at gmail.com')
   parser.add_argument("-m", choices=['1','2','3', '4'],help="<int>: '1'(pair-end reads, interleaved),'2'(pair-end reads, seperated),'3'(single-end reads), '4'(assembly)")
   parser.add_argument("-i", nargs="+", help="<string>: path/to/input_data")
-  parser.add_argument("-b",choices=['sam','mem'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam") 
+  parser.add_argument("-b",choices=['sam','mem','nanopore'],default="sam",help="<string>: 'sam'(bwa samse/sampe), 'mem'(bwa mem), default=sam")
+  parser.add_argument("-d",help="<string>: output directory name, if not set, the output directory would be 'SeqSero_result_'+time stamp+one random number")
   args=parser.parse_args()
   dirpath = os.path.abspath(os.path.dirname(os.path.realpath(__file__)))
   if len(sys.argv)==1:
@@ -19,7 +20,9 @@ def main():
   else:
     request_id = time.strftime("%m_%d_%Y_%H_%M_%S", time.localtime())
     request_id += str(random.randint(1, 10000000))
-    make_dir="SeqSero_result_"+request_id
+    make_dir=args.d
+    if make_dir is None:
+      make_dir="SeqSero_result_"+request_id
     os.system("mkdir "+make_dir)
     os.system("cp -rf "+dirpath+"/database "+make_dir)
     mode_choice=args.m


=====================================
database/FliC_Family_k,z_special_genes.fasta
=====================================
@@ -1,52 +1,50 @@
->fliC_k_Salmonella.enterica_IIIb.42:k:e,n,x,z15_AY353436
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
->fliC_k_Salmonella.enterica_IIIb.61:k:1,5_AY353539
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
->fliC_k_Salmonella.enterica_IIIb.50:k:z_AY353538
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATTCTGCTAAAAGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
->fliC_k_Salmonella.enterica_IIIb.50:k:z53_AY353440
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
->fliC_k_Salmonella.enterica_IIIb.17:k:z_AY353437
-GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
->fliC_(k)_Salmonella.enterica_IIIb.16:(k):e,n,x,z15_AY353541
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
->fliC_k_Salmonella.enterica_IIIb.65:(k):z_AY353438
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
->fliC_(k)_Salmonella.enterica_IIIb.42:(k):z35_AY353542
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
->fliC_k_Salmonella.enterica_IIIb.38:(k):z53_AY353540
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
->fliC_k_Salmonella.enterica_IIIb.38:(k):z35_AY353439
-GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
->fliC_z6_Salmonella.enterica_II.48:e,n,x,z15:z6_AY353519
-GATAGCAAAGCTGTAACAGTAGCTGCTAATTTAGATATTACTGATCTTAATAAAGATGCGGCCCTTAAAGCAGGGACTGGTGCTACAACAGGTACTGCAGCAATAAAAGATGACAAAGTTTATTATGATAGTGCTAGCAAAAACTACTACGTTGAAGTTACCGGTCTGACTACCCCTGATGACGGTAAAAATGGCTTCTATAAAGTAAATGTCGCCGATGATGGTAAGGTATCTATGGCCGCTGGTACGGCTATGGAGGCGGGTAAACCAGCTGGTGCGGTAGAAGTAACAAAAACTCAGGAAGAGAAAAATCCATTACCGTTATCAGCAGATCTCAAGACTTCTCTTAAATCTGGCGGGGTTACAGATCCAGAAATTGCTGCTGCCCAAGTT
->fliC_z_Salmonella.enterica_II.16:z:z42_AY353469
-GATAGCAAAGCTGTGACCGGTGTTTCTAATTTGGATACTACAGGTCTTACTGGCGCAGCTATTAAAACTGGCGTTGCTGGAGCTACCACTACGAGTGGTTCCATTAAAAATGACAAAGTATACTATGATGATGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTGCTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACG
->fliC_k_Thompsonstr_AOXP01000022
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
->fliC_k_Thompsonstr_AMSN01000007
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
->fliC_k_Salmonella.enterica_Blockley_AY353442
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
->fliC_z_Indianastr_AOZC01000051
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACGGCAGAAATGGTC
->fliC_z_Salmonella.enterica_Indiana_AY353468
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACG
->fliC_z41_Salmonella.enterica_Maska_AY353511
-GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGTATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATGGCTGGAAATATTGATACTGCTGATGCAGATGCTGCTGAAATGGTCAAAATG
->fliC_z_Salmonella.enterica_II.40:z:z42_AY353470
-GATAGCAAAGCTGTGACCGGTGTTTCTACTTTGGATACTGCAGGACTTACTGGCGCAGCTATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGTTCCATTAAAGATGGCAAAGTATACTTTGATGATGCTACTAAAAATTATTATGTTGAAGTAGAGTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGTACTGTTACAATGGGGGCTTCGACTACTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGTTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACGGCAGAAATG
->fliC_k_Invernessstr_AOZD01000019
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
->fliC_k_Salmonella.enterica_Inverness_AY353441
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
->fliC_z44_Salmonella.enterica_Quinhon_AY353513_k,z
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGACTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTGCTAAAAATTATTATGTTGAAGTAGACTTTTCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGACGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATACTGCTGATGTAGCTACGGCAGAAATG
->fliC_z_Salmonella.enterica_Poona_AY353467
-GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATGCTGCTGATGTAGCTACG
->fliC_z41_Salmonella.enterica_Ottawa_AY353510
-GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGGATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATTGCTGGAGATATTGATACTGCTGATGCAGATGCTGCTGAAATG
->fliC_z44_Salmonella.enterica_Bulovka_AY353512_k,z
-CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGGCTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGATGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCAAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAA
->fliC_z69_Salmonella.enterica_Pietersburg_AY353520
-GATAGTAAAGCTGTAACAGTAGCTGCTGATTTAGATATTACCGCTCTTAATACCGATGCAGCTCTTAAAGCAGGAACGGGAGCTACAACAGGTACTCCATCAATAAAAGATGACAAAGTTTATTATGATAGTGCCAGCAAAAACTACTACGTTGAAGTTACCGGATTAACCGCCCCTGATGATGCTAAGAATGGCTTCTATAAAGTAAATGTTGCTGATGACGGTACAGTATCCATGGCCGCTAATACAGCTATAGAGGCGGGTAAACCAGCCGGTGCAGTAGAAGTAACAAAAACTCAAGAAGAAAAAAACCCATTACCATTATCAGCAGATCTCAAAACTTCTCTTAAATCTGGCGAGATTACAGATCCAGACATT
+>fliC_k_Salmonella.enterica_IIIb.42:k:e,n,x,z15_AY353436
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
+>fliC_k_Salmonella.enterica_IIIb.61:k:1,5_AY353539
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAAATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
+>fliC_k_Salmonella.enterica_IIIb.50:k:z_AY353538
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATTCTGCTAAAAGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
+>fliC_k_Salmonella.enterica_IIIb.50:k:z53_AY353440
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAA
+>fliC_k_Salmonella.enterica_IIIb.17:k:z_AY353437
+GATAGCAAACCAGCGCAGAGCATTAAACTGGATACCAGTGCTCTTACTGCTACTGCAATTAAAGATGGTGTAACTGGTGCATCGACAGATGGTGCCCTAAAAGACGGTAAAGTTTACTCTAATGGCACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGATACTGCTAAAGGTGGTTTCCTTAAAGTAGATGTTGATTCCGCTACTGGTGCAGTTACCGTTCCGGGTACGGCAGCAACAGCAGCTGCAACTAAACCTGCCGGTGTGAAAGAGGTTACAGAAGTACAAGGTAAAATCCCAGCATCTACTGCTATTCAAGACCAATTGAAAGCAGGCGGTGTGACTACTGCAGATGCAGCTACTGCTGAAGTT
+>fliC_(k)_Salmonella.enterica_IIIb.16:(k):e,n,x,z15_AY353541
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
+>fliC_k_Salmonella.enterica_IIIb.65:(k):z_AY353438
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATG
+>fliC_(k)_Salmonella.enterica_IIIb.42:(k):z35_AY353542
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
+>fliC_k_Salmonella.enterica_IIIb.38:(k):z53_AY353540
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
+>fliC_k_Salmonella.enterica_IIIb.38:(k):z35_AY353439
+GATAGCAAACCAACAAGTATGAAGTTGGATACTAGCGGTATAACAGCGGAGGCAATTAAAAACGGTGTAACTGGCGCAACGACAGATGGTGCACTTAAAGACGGCAAGATTTATTCCGATGGTACTAACTACTACGTAGAAGTTAGCTTTGCTGCTACCGCAGACACAAGTAAAGGCGGTTTTCTTAAAGTGGATGTTGATTCCTCTAATGGTAAAGTGTCTATTCCTACCACTGCTGCATCTGCTGTCGCGGCAAAACCAGCTGGAGTAAAAGAAGTTTCTGAAGTTCAAGGGAAAATTGCTGCATCAACAGATGTTAAAAATCAATTGACAGCAGGCGGTATTGATGCTGGTGTTGCCGCCAATGCAGAAATGGTC
+>fliC_z6_Salmonella.enterica_II.48:e,n,x,z15:z6_AY353519
+GATAGCAAAGCTGTAACAGTAGCTGCTAATTTAGATATTACTGATCTTAATAAAGATGCGGCCCTTAAAGCAGGGACTGGTGCTACAACAGGTACTGCAGCAATAAAAGATGACAAAGTTTATTATGATAGTGCTAGCAAAAACTACTACGTTGAAGTTACCGGTCTGACTACCCCTGATGACGGTAAAAATGGCTTCTATAAAGTAAATGTCGCCGATGATGGTAAGGTATCTATGGCCGCTGGTACGGCTATGGAGGCGGGTAAACCAGCTGGTGCGGTAGAAGTAACAAAAACTCAGGAAGAGAAAAATCCATTACCGTTATCAGCAGATCTCAAGACTTCTCTTAAATCTGGCGGGGTTACAGATCCAGAAATTGCTGCTGCCCAAGTT
+>fliC_z_Salmonella.enterica_II.16:z:z42_AY353469
+GATAGCAAAGCTGTGACCGGTGTTTCTAATTTGGATACTACAGGTCTTACTGGCGCAGCTATTAAAACTGGCGTTGCTGGAGCTACCACTACGAGTGGTTCCATTAAAAATGACAAAGTATACTATGATGATGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTGCTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACG
+>fliC_k_Thompsonstr_AOXP01000022
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
+>fliC_k_Thompsonstr_AMSN01000007
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
+>fliC_k_Salmonella.enterica_Blockley_AY353442
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
+>fliC_z_Indianastr_AOZC01000051
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACGGCAGAAATGGTC
+>fliC_z_Salmonella.enterica_Indiana_AY353468
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCGCGAATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGCGTCGATGCTGCTGATGCAGCTACG
+>fliC_z41_Salmonella.enterica_Maska_AY353511
+GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGTATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATGGCTGGAAATATTGATACTGCTGATGCAGATGCTGCTGAAATGGTCAAAATG
+>fliC_z_Salmonella.enterica_II.40:z:z42_AY353470
+GATAGCAAAGCTGTGACCGGTGTTTCTACTTTGGATACTGCAGGACTTACTGGCGCAGCTATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGTTCCATTAAAGATGGCAAAGTATACTTTGATGATGCTACTAAAAATTATTATGTTGAAGTAGAGTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGTACTGTTACAATGGGGGCTTCGACTACTAAAGAAGCCGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGTTGATGTGAAAGCTGCTCTGACTGCTGGTGGCGTTGATACTGCTGATGCAGCTACGGCAGAAATG
+>fliC_k_Invernessstr_AOZD01000019
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTGAAAATGTCT
+>fliC_k_Salmonella.enterica_Inverness_AY353441
+CAAGCTACAGTTGAAAACAGTGTCAAACTGGATACTAGTGCTCTTACTGCCGATGCAATTAAAGGTGGCGTAACAGGTGCGACAACAGCTGGTGCCCTCAAGGACGGTAAAGTTTACTCTAATGGTACAGATTACTATGTAGAAGTAAGCTTTGCTGATGCGACTGACTCAGGTAAAAATGGTTTCCTTAAAGTTGACGTTAATACAACTACTGGAGCGGTTACAGTTCCTGCAGCAGCAGCAAATACTGTAGCAGCAAAACCAGCAGGTGTGTCTGAAGTTACTGAAGTTCAGGGACTAAATACACCGAGTTCGGCTGTACAAGATCAGTTAACAGCTGCAGGTGTAAGTGCCGCTGATGCTGCTAAATCTGAAGTTGTG
+>fliC_z44_Salmonella.enterica_Quinhon_AY353513_k,z
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGACTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTGCTAAAAATTATTATGTTGAAGTAGACTTTTCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGACGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATACTGCTGATGTAGCTACGGCAGAAATG
+>fliC_z_Salmonella.enterica_Poona_AY353467
+GATAGCAAAGCTGTGACTGGTGTTTCTACTTTGGATACTACAGGTCTTACTGGCACGGATATTAAAACTGGCGTTGATGGAGCTACCACTACGAGTGGCTCCATTAAAGATGGCAAAGTATACTATGATGGTGCTACTAAAAATTATTATGTTGAAGTAGACTTTTCTGATGCCGCTGATACTGCTAAAAATGGCTACTATAAAGTCAATGTTGCTGATGATGGCACTGTTACAATGGGGGCCTCGACTACTAAAGAACCTGCGAAACCTGCAGGTGTTGTTGAAGTAACGAAAACCCAAGAAGAGAAAGCAATTAAGGCGTCTGCTGAGGTGAAAGCTGCTTTGACTGCTGGTGGTGTCGATGCTGCTGATGTAGCTACG
+>fliC_z41_Salmonella.enterica_Ottawa_AY353510
+GATAGCAAAGCTGTTACTGCAACTCTTGATCTGGATGTGACAGATCTTGATACTAATGCTTTGAAAACCGCAACTGGGATCAGTGCAGGTAATCCTGCTGTTAAAGACGATAAAGTTTATTATGACAGCGCAAATAATAATTATTATGTAGAGGTTGAGGGCTTTACTGATAATACGAAAGATGGTTTCTACAAAGTTCAGGTTGGTGATGATGGCAAAGTGTCAATGGCCACAACTACCAATAAAGAAACAGCTACTCCTCCCGGAATTGTTGAAGTAAGTAAAACTCATGATGAGAAAGCTCTTAAAGCTTCTGCAGAGGTTAAAGCAGCTCTGATTGCTGGAGATATTGATACTGCTGATGCAGATGCTGCTGAAATG
+>fliC_z69_Salmonella.enterica_Pietersburg_AY353520
+GATAGTAAAGCTGTAACAGTAGCTGCTGATTTAGATATTACCGCTCTTAATACCGATGCAGCTCTTAAAGCAGGAACGGGAGCTACAACAGGTACTCCATCAATAAAAGATGACAAAGTTTATTATGATAGTGCCAGCAAAAACTACTACGTTGAAGTTACCGGATTAACCGCCCCTGATGATGCTAAGAATGGCTTCTATAAAGTAAATGTTGCTGATGACGGTACAGTATCCATGGCCGCTAATACAGCTATAGAGGCGGGTAAACCAGCCGGTGCAGTAGAAGTAACAAAAACTCAAGAAGAAAAAAACCCATTACCATTATCAGCAGATCTCAAAACTTCTCTTAAATCTGGCGAGATTACAGATCCAGACATT


=====================================
database/FliC_Family_l,v_special_genes.fasta
=====================================
@@ -6,8 +6,6 @@ AATACCACTGGTCTTAATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGG
 AGTACCACTGGTCTTGATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAGCGGTACCGCTGCAATTAAGGATGGTAAAGTCTTCTTTGATGCAACTGATAATAAATATTTTATTGAAGTTGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
 >fliC_l,z13_Salmonella.enterica_Kenya_AY353449
 AGTACCACTGGTCTTGATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAGCGGTACCGCTGCAATTAAGGATGGTAAAGTCTTCTTTGATGCAACTGATAATAAATATTTCATTGAAGTTGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACTACG
->fliC_l,v,z13_Salmonella.enterica_Kimberley_AY353448
-AATACCACTGGTCTTAATGATGCAGCTCTTAAAACGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGGTAAAGTCTTCTTCGATGCAACTGATAATAAATATTTTATTGAAGTAGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
 >fliC_l,w_Salmonella.enterica_Glidji_AY353447
 AATACCGCTGGTCTTAATGATACAGCTCTTAAAGCGGGTGTTGGTGGTGCAACAAACGGTACTGCTGCAATTAAGGATGGTAAAGTCTTCTTCGATGCAACTGATAATAAATATTTTATTGAAGTAGAAGGTTTAACCGCTGGCGACGCTACTAAAAATGGTGTTTATGAAGTTAGTGTTGCAGATGATGGCACTGTTACAATGCCGGCAACCACG
 >fliC_l,z28_Salmonella.enterica_Javiana_AY353455


=====================================
database/FljB_1_2_7_whole.fasta
=====================================
@@ -1,5 +1,7 @@
 >fljB_1,5_Salmonella.enterica_IIIb.61:k:1,5_AY353278
 ATGGCACAAGTAATCAACACTAACAGTCTGTCGTTGCTGACCCAGAATAACCTGAACAAATCCCAGTCCGCACTGGGTACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTCACTGCGAACATCAAAGGCCTGACTCAGGCTTCCCGTAACGCTAACGACGGTATTTCTATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCTATCCAGGCTGAAATCACCCAGCGTCTGAACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTTCTGGCGCAGGATAACACCCTGACCATCCAGGTTGGTGCCAATGACGGTGAAACCATCGATATCGATCTGAAGCAGATCAACTCTCAGACTCTGGGTCTGGATACGTTGAATGTGCAAAAAGCGTATGATGTGAAAGATACAGCAGCAACAACGAAAGCTTATGCTGATAATGGTACTACACTGGATGTATCAGGTCTTGATGATGCAGCGATTAAAGCGGCTACGGGTGGTACGACTGGTGCGCCTACTGTAACGGGCGGTGCGGTTAAATTTGACGCAGATAATAACAAGTACTTTGTTACTATTGGTGGCTTTACTGGTGGTGATGCTGCCAAAAATGGCGATTATGAAGTTAACGTTGCTACTGACGGTAAAGTAACACTTGCGACTGGTGCAACTAAAACCACAATGCCTGCAGGTGCTACAACCAAAACAGAAGTACAGGAATTAAAAGATACACCGGCAGTTGTATCAGCTGATGCTAAAAATGCTTTAATTGCTGCTGGCGTTGATACTACAGATGCAAATGCCGCGACATTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAATATTACGCTGCTGATTACAATGAAACTACAGGAGCTATTAAAGCTAAAACCACAAGTTATACTGCTGCTGACGGTACTACTAAAACGGCGGCTAACCAACTTGGTGGCGCAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTATAATGCCAGCAAAGCTGCTGGTCATGATTTCAAAGCACAGCCAGATCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCTGCGCTGGCACAGGTTGACACGTTACGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAATTCCGCCATCACCAACCTGGGCAACACCGTAAACAACCTGACTTCTGCACGTAGCCGTATCGAAGATTCTGACTACGCGACTGAAGTCTCCAACATGTCTCGCGCGCAGATTCTGCAGCAGGCGGGGACTTCCGTTCTGGCGCAGGCTAACCAGGTCCCACAAAACGTGCTGTCTCTGTTACGTTAA
+>fljB_1,5_Muenster_DTU-unknown_another_1,5
+ATGGCACAAGTCATTAATACAAACAGCCTGTCGCTGTTGACCCAGAATAACCTGAACAAATCCCAGTCCGCTCTGGGCACCGCTATCGAGCGTCTGTCTTCCGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGTCTGACTCAGGCTTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTGAACGAAATCGACCGTGTATCCGGTCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAGGACAACACCCTGACCATCCAGGTTGGTGCCAACGACGGTGAAACTATCGATATCGATCTGAAGCAGATCAACTCTCAGACCCTGGGCCTGGATTCACTGAACGTGCAGAAAGCGTATGATGTGAAAGATACAGCAGTAACCACGAAAACTTATGCCAATAATGGTACTACACTGGATGTATCGGGTCTTGATGATGCAGCCATCAAAGCGGCCATAGGTGGTACGACTGGTACGCCTGCTGTAACGGGCGGTACAGTTAAATTTGACGCAGATAATAATAAGTATTTTGTTTCTATTGGTGGCTATACTGGTGCTGATGCATCCAAAAATGGCGATTATGAAGTTAACGTTGCTGCTGACGGTAAAGTTACACTTGCTACAGGTGCAACTAAAACCACAATACCGGCAGGTGCGACAACTAAAACAGAAGTACAGGAGTTAAAAGATACACCAACAGTTGTTTCAGCAGATGCGAAAAATGCCTTAATCGCTGGCGGCGTGGATGCTACCGATGCTAATGGCGCTGAGTTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAGTATTACGCCGCAGATTACGATGAAGCGACAGGAGCAATTAAAGCTAAAACCACAAGTTATACCGCTGCTGACGGCGCTACCAAAACAGCGGCTAACCAACTGGGTGGCGTAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTACAATGCCAGCAAAGCCGCTGGTCATGATTTCAAAGCACAACCAGAGCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCCGCGCTGGCGCAGGTGGATGCGCTGCGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAACCTGTCTGAAGCGCGTAGCCGTATCGAAGATTCCGACTATGCGACCGAAGTCTCCAACATGTCTCGCGCGCAGATTCTGCAGCAGGCCGGTACTTCCGTTCTGGCGCAGGCTAACCAGGTTCCGCAAAACGTCCTCTCTTTACTGCGTTAA
 >fljB_1,7_Salmonella.enterica_Bredeney_AY353296
 ATGGCACAAGTAATCAACACTAACAGTCTGTCGCTGCTGACCCAGAATAACCTGAACAAATCCCAGTCCGCACTGGGCACCGCTATCGAGCGTCTGTCTTCTGGTCTGCGTATCAACAGCGCGAAAGACGATGCGGCAGGTCAGGCGATTGCTAACCGTTTTACCGCGAACATCAAAGGTCTGACTCAGGCCTCCCGTAACGCTAACGACGGTATCTCCATTGCGCAGACCACTGAAGGCGCGCTGAACGAAATCAACAACAACCTGCAGCGTGTGCGTGAACTGGCGGTTCAGTCTGCTAACAGCACCAACTCCCAGTCTGACCTCGACTCCATCCAGGCTGAAATCACCCAGCGCCTGAACGAAATCGACCGTGTATCCGGCCAGACTCAGTTCAACGGCGTGAAAGTCCTGGCGCAGGACAACACCCTGACCATCCAGGTTGGTGCCAACGATGGTGAAACTATCGATATCGATCTGAAGCAGATCAACTCTCAGACCCTGGGTCTGGATTCACTGAACGTGCAGAAAGCGTATGATGTGAAAGATACAGCAGTAACAACGAAAGCTTATGCCAATAATGGTACTACACTGGATGTATCGGGTCTTGATGATGCAGCTATTAAAGCGGCTACGGGTGGTACGAATGGTGCACCTAGTGTAACAGGTAGTGCGGTTAAATTTGACGCAGATAATAACAAGTACTTTGTTACTATTGGTGGCTTTACTGGTGCTGATCTCGACAAAAATGGCGATTATGAAGTTAACGTTGCTACTGACGGTACAGTAACCCTTGCGGCTGGCGCAACTAAAACCACAATGCCTGCTGGTGCGACAACTAAAACAGAAGTACAGGAGTTAAAAGATACACCGGCAGTTGTTTCCGCAGATGCTAAAAATGCCTTAATTGCTGGCGGCGTTGACGCTACCGATGCTAATGGCGCTGAGTTGGTCAAAATGTCTTATACCGATAAAAATGGTAAGACAATTGAAGGCGGTTATGCGCTTAAAGCTGGCGATAAGTATTACGCCGCAGATTACGATGAAGCGACAGGAGCAATTAAAGCTAAAACCACAAGTTATACCGCTGCTGACGGCACTACCAAAACAGCGGCTAACCAACTGGGTGGCGTAGACGGTAAAACCGAAGTCGTTACTATCGACGGTAAAACCTATAATGCCAGCAAAGCCGCTGGTCATGATTTTAAAGCACAGCCAGAGCTGGCTGAAGCAGCCGCTAAAACCACCGAAAACCCGCTGCAGAAAATTGATGCCGCGCTGGCGCAGGTGGATGCGCTGCGTTCTGACCTGGGTGCGGTACAGAACCGTTTTAACTCCGCTATCACCAACCTGGGCAATACCGTAAACAACCTGTCTGAAGCGCGTAGCCGTATCGAAGATTCTGACTATGCGACCGAAGTTTCCAACATGTCTCGCGCGCAGATCCTGCAGCAGGCCGGTACTTCCGTTCTGGCACAGGCTAACCAGGTCCCGCAGAACGTGCTGTCTCTGTTACGTTAA
 >fljB_1,2_Salmonella.enterica_Typhimurium_AY353264


=====================================
database/H_new_fliC_protein_database.fasta
=====================================
@@ -302,8 +302,6 @@ MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTSNIKGLSQASRNANDGISIAQTTEG
 MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTATLDLDVTDLDTNALKTATGISAGNPAVKDDKVYYDSANNNYYVEVEGFTDNTKDGFYKVQVGDDGKVSMATTTNKETATPPGIVEVSKTHDEKALKASAEVKAALIAGDIDTADADAAEMVKMSYTDKNGKTIDGGYAVKVGDNYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGADGKTEVVSIDGKTYNASKAAGHNFKAQPDLAEAATATTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
 >z41__Salmonella.enterica__Maska__AY353511__k,z
 MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTATLDLDVTDLDTNALKTATGISAGNPAVKDDKVYYDSANNNYYVEVEGFTDNTKDGFYKVQVGDDGKVSMATTTNKETATPPGIVEVSKTHDEKALKASAEVKAALMAGNIDTADADAAEMVKMSYTDKNGKTIDGGYAVKVGDNYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGVDGKTEVVTIDGKTYNASKAEGHNFKAQPELAEAATATTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
->z44__Salmonella.enterica__Bulovka__AY353512__k,z
-MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDSLNVQKAYDVQATVENSVKLDTSALTADAIKGGVTGATTAGALKDGKVYSNGTDYYVEVSFADAADSGKNGFLKVDVNTTTGAVTVPAAANTVAAKPAGVSEVTEVQGLNTPSSAVQDQLTAAGVSAADAAKSEVVKMSYTDKNGKTIDGGFGIKVGDDIYAATKNKDGSISINATEYTDKDGNTKTALNQLGGVDGKTEVVTIDGKTYNASKAAGHDFKAQPELAEAAAKTTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
 >z44__Salmonella.enterica__Quinhon__AY353513__k,z
 MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQKAYDVDSKAVTGVSTLDTTGLTGTDIKTGVDGATTTSDSIKDGKVYYDGAAKNYYVEVDFSDTAKNGYYKVNVADDGTVTMGASTTKEPAKPAGVVEVTKTQEEKAIKTSAEVKAALTAGGVDTADVATAEMVKMSYTDKNGKTIDGGYAVKVGDSYYAATQKKDGSFSVNTTSYTDKDGNTKSALNQLGGVDGKTEVVTIDGKTYNASKAAGHDFKAQPELAEAAAKTTENPLQKIDAALAQVDALRSDLGAVQNRFNSAITNLGNTVNNLSEARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLR*
 >z47__Salmonella.enterica__IIIb.38:z47:z53__AY353514__other.z47


=====================================
database/special_O_genes.fasta
=====================================
@@ -89,6 +89,8 @@ ATGTCGTACAAAAGTAATAATTTCTATAGAAATATACTTTTATTGAGTTTTTTCTTTTCTGGCTTTAGCTTGTATACTGT
 ATGATTGAAGGATATGTAGTATATAATAGTATTTTTCTTCTTGCCTTACTATTTGGCTTTATGAAGAATTACTGTCTTCGGAAATATTTTTTATTATGCTTATTCCTTGTCTTATGGGTTCCACTTGCCACTCGTTATGGCATTGGTCGTGACTATTTTAGCTATGTTGATATTTATAAAAATGTGTTAGTTACCAGAGATGGTATTGAAGTAGGTTTTTATTATCTAAATTATCTGTTGGCATATTTTGGTTTCCATTATCAATCTATATTTATATTGACATCTTTTATTACTGTCTATTTAAGTGTTAAAAGTTTTGATAGAGAATATACAATAGTATCAATTATATTATTTGGGGTTTTGGTTTACTTACAGGCGTTTAGTATTGTTAGGCAAATGCTTGCTGTAGCCTTATGTCTTTATAGCTGTTCGTTATGGAATAAAGGTGTTAAGGTTAAAGCAATTATTTTTCTTATGCTGGCACCTTTGTTTCATTATTCTGCTGTAATAATATTTATATTGGCAATAATTAGCAGATGTGTTAAAATCGATACGTTTAAATGTCTTGCTATGTTAGGGCTTAGCCTTATTTTTGTTTTTGTATTTAATGGGATCGATTTTATATTTTCAAATCCTATACTATTAAATAGTAAGTATGGATATTATGTAACATCAGCCTTTAACAGACCGACTGAAATAGGTTCAGGCATTGGAGTGGCAATAGCATTATTTCTTCCATTCTTGATTTTTATGAAAGCATCAAAAATATATAAACATAATAAAAATTATAATCTGATGCTATTAATAAACCTTGTATATGTTGTTTCATTTGTTTTATCTTTGAAAATATATATATTCGCCAGATTCACTGATGCGCTATCCTTTGTCCTGATATTACTTATCCCTGCTGCTCTTAAAATATCAAATACTAGAGGCCTATATTATAACTGTATGTTATCTGTTGTTATTCTTCACATTATGCTATTTGAAGTAAATCTTAAAGCAAATACAATTGCAGCTGGAGATATGTCTAATAGCGGGCTTGGAATCATGCCGTATAGCAACATAATAAACGCACATATGCTAAAATACTAG
 >O_48_wzy
 GTGATTATAAAGAAGAATAAATTTGTTTATTCGGTACTTAAAGTCTGGTTAATAGTCTCTTCATTGTATTATTTAAATGCTATTTTTTCCGGTGTTGATGCGTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAATATGTTTTATAATAAGTTTTTTTATTCTGTTCAATAGTAAACGAGTCAAATTTTTGGGGGCTTCGTTATTTTTCATAATCCTTTCGGTAGCTTCAGTAGTTATTGGTAATGTAGTAACGGTATATGCTACCGCGATGCTGATAATTGCTACCATGGTTGGTTTCAGCCAAATTATTCTTTATTTTTCTAATGATATGTCGAAGATTAATATGGTTTTATTATGGACTGGAATTATAATAGGCGCCATTTCTGTATTAGAATTAACAGTATTCTACGATTATATGGTCTCATATTGGGTTTCGACTGGTGGAGTCCGATCAATATCTTCTCTTCTTAATCCTACAAATAGCGGGGCTTATTCAGCGATTATAATTTTAATTGCTTTAGGGACTAATATAAGGAGTAAATTTAAGAGAACTTTATTTGCTTTAATGCCAATGATTACTTTAATCAGCAGCGGATCACGTACAGCATGGTTATCATTAGCATTAACATTATTATTGACGGTATTATTAAATGATAAGGCTAGTATACGATTACGGAAAAAAATATTAGCTATTGCAGGTATTGGAGCTATTTGTGGTGTGTTATATGTAGCATTTTATATGAGTAGTATCTCTGGTATTCAATCCCAACATCGAGGGCTTGATACATATACCGCATCAATTCGAGTTGAAAACTTTATAACATATATGAATTCAATTGATTTTGATATGTTATTACCTGATTTCCTTGATAAAAATATTAACCTTATATCAGATAATTTTTATCTAGTGTTATTAAATTATTTTGGAATTATTGGGGGTTATATTGTTTTTTTTATTTCAGTATTATTATTCTATTATAATATGCAAACAAAGGATTTTGATAAAAATATAGATGAAAGTATTTCTGTTTGGAGAGTGATATTCATCTATTTTCTGATATCTGGACTTTCAAACTCATTCATAAATTCTTTTCCTGTAAACCAACTATTTTTTATCTCATGCGGGTATTATGTGTATAAATATAACTTAATAAAGAAAAATGCTGGAAAGCAAATATGA
+>O_48_unknown-from-cdc-new-genomes-sequence
+CTGCAGCAAGCTCCTGAAGCTTATCCCCACCTTGAGCACCAAATTTCCAATTTTGTAAAATGTTACTCTTAAAGTTGCTACAATAATCACACTCTCCACTATTATCAAAAACTATGTTAGGATCAGATGTATCCATAATACAATGGCTACAAACTTTATAACTTTGATTTTCCATGTTCCCCCCTATTTAAAATGACTTTCATAACAATTTCATTAATTTCTTCTGTTTGTACTACATGTAATCCATGAAATAACACTAGTGTTCCCATTTCTTCATATTTATATGCAAGAGTTGATGGATATGAGATAACTACATCAACCTTAGGAAAAAAGTTATCGTCTATAATAAAATTGAATTTAAATTGCCTGACTTTTGAGGAAGCTCTTGCCTTAGGATGCTCTTTATAATAAATAGAACAATTTTCAATTTGTTGATTAATTAGAGAGCAAATTTTTAGCTGACCTTTCTCACACAATGAATGCCCAATAACTAACAATGTTAGCTGGTTCGATGATACTTGAGTAAGGGACAACATAGGTTTACTATATTCCACCTTTATAATTTCGGCCAAATTATAATCCAGTATGTTGTTTATAAACAATTGAAATTCAACTTCATCGAAAACAATTATTTTATCCAAATGCTTTAATTTATATGGTATCTTAAAAAGTAAATAGGCACTTGAATCAAGGGCTCTCAAAGATCCATGCTGGATAAGAGTATATTGAATTCCTTTTTCTCCTAACATTGAATCAATCAGGACCGCCCAACGATCATAATGTTCACTACTTATAACCTTTCCTTGTATTCTATTCATCACTAATGCGACAAGGAACCAAGATGGAGCTGTGTATATTTGCAGGCACCATTTGATAGTATGCTTCGATTTAAAAAAATAGAAAAACGCAAATATGCTTAGCAACATGCTTTTGAAAATATCTAAATACGAAGCCATCTCATAAATTGAAATAACTGTAGCATCACTTCTATCATTACACGATGATAATTTAATAACATTTAACTTTTTTCCATCCGAAATTTTACTATTATAATAATTAATTGCTTGCTCCGTACCTATTTCAGCGAATGAAAAATAGTAAAAGTCGCTTCTATCAATCAATTTATTTTTATCTGTAATTATTTTTTTGTATAATGCAACTATACATTTTAATATAGGATAAAATATAAACCCCCCTAATATGAAGAAAATCATAAGAGAGATATATCCCCCCCACAATTTATGCCTCCCATATGCCCATTTGCTGATCCGAGGTAATGGTGGTATTCTACCTTTCATGCCAGCGATCAACAATTTATCAATAGAGATTTCATTTTCCGTAGCTAACATATAGTAGCGTAAATATGTTTTATAAGAAATTCTCATCCGACATGCCCGTCATTAATAATATGTAGACGCTCTAATTAATAATCAATTATTGACTTTTTTAGAGATATTTGTAACTAGTTAACATGAAAAATTCATATAAAAATGCTAAGTCATCTTCTTATTTATATTTTTCTTGTTGACTAAATAAATTATCGATATAAAAATCATAACTGCTGACGGTGTAAAATACCCAGAACCTCTTAGCAAAAAATATATTATGCTCATTATTAAAACTATACTAAAAAACTTTATTTTTTTGTCATTGCATTTAAACCGCATGACACCTAAAAATAATGTATAAAGAAAAAAAATGCCCCCTAAGATACCAAATTCAACAATCAATTTAGAAATAAATAGTCCACCATCATATAAGTTAGAATCTGTATTCCCTCCCCTTAACCGCCCAATGATTGATACAAACTCTCCTCTTTCATTTGCATATCCCATATTTTGTAAACCATAACCAAGGCCATAGCTATCTCGCAACGCTAGATATGCTTGTTCATATCCAGATAATAAAGTTAATGTTGATGTATTTTTCGATTCTTGGCTTATATCTAATCGTTGCGAATAATAACTTAGTTTATCAATAGGTAAGATTCCAGCAATCAGCATACACGATGAAGATACGCAAATCATAATAATGAACATTGATTTAACTCTCATATAGTTTATAGCTATCGCTACAACAATACCTATAATCAATGTTAAATTCTGGACAATAAGAGCCGTAAATAAAAGAGGAATTCCATAGAGCAAATTTAATTTTTTCTGAGATATCTTATAGCAATAAAAGATTGTAACTATTAGTGCATAATGAGAGGGCTCAGTAAAAAACAACATTTCCTTTGAAGTGCTACTGCTTGATAATATAAAAAGAGATGACAATACCCCCAAAGCTATTAGTAATTTAAATAATTTTGATACTATTCTATCAAACTCCTGGTGAGTAATATTATCAATTGCCACCGATGAAAAATAACATGCGAGTAAAATATAAAATAAGAATAACAATGATGTAATATTCTTAGTGAAAGTAGTATTACCATTCTGAAATAGTAGACTACTTAACCCAAAATGAAACAATATTAGAAAAAAACTAATAACACTAAAAATTAAAAATGAATAACTTATAGTTAATTTATTAAAGCCAGAAATAACCACTAAAAATAATATTATAGTTGATATAAAGAAAATACCAATGAAATTCGAACCAACTTTATCATTTAACACCATTAACAGGCCTGGAACCAGCACCATTCCATAAAAAAATATTGAGGTCAGAACTTTATTAGTATTAAATTGCATTATAGTTAAACCTTATTATTCCTTTTAATTACAATAAAAAATTATATAGCATAAGTATTTTAATTTAAAACAATTAAACTTTTCGTACTTTTCGTAGTTCATGCTTTTAATAATAAACTATGTATCTCACCGAGAAATTCGCTATAACAAACGTAACACTATGCATTTTATATCTATATAAAATACAATAGGTAAGATATCATCTATTAGAATAAAATAAACTCTCGCCGGCAGATCGTCTAATTATAACCAAGAGTTTTATAAACATAGCCAGCTTTAAAAATAATAAAACTGAAAAAGAAATAATCATACCATAAGCAATGTAATTAATATTCGCGACCTTAAGTGCAATATAAAGAAAAGATGAAAACAGTAAAAAAGTTAAACACTGGCTCCAGACTATCATTTTATCTTTTCTTAGTGCATACAGACCCAGATGTGGTATAAGGCTTAAACAATATATAAACGTCGCCACAATTAGCAACTGAAATAGTGGAAGTAATTCCCAATATTCGATCTTTCCAATCCACTGAATGAGGATATAACCGGTAAAAAAACAACAAATACATAACAGAAGCGACACTGCTATTAATTTGAATGCGAATGACTTCATTCCAGCGATGAATCCAATGTAGTCCTTTCGATAACACAATTTTGCCAATTTTGGGAATGAAAAAGATATTAGGATCGTATCGAGGAAAGATTGTATAGCCGCCGTCATACTAATAAACAAAGTATATACACCAAGGATCTTTAGTCCAGCAATATGTTCAACGGCAAACCTATCAAATGTAAAAAAACCTCTGAGCGCCAAAGCGGCAATTAGCATTGGTGCGGAAAGGATAATTCCTCTCATTATCCAGCGCCAGCTAAATGGCGATGTAAACTTCCGTTTATTATTTTTTAGAATATAAAAAAAGCCCATTGCACTAGCACAGAATGTACCAAATAGCCATAATGTAAATACAATAAATAGATTTCTTGACGTAGGAAATAATAGCATAATGGCTATCACGAGCCAGCACCAAAGTCCTTGTCGTATAAACAACACAAGACTTGCGAAAGCTTGATTCTCGAGAGTTATTAATATTCTATTAATTTCTTGAGCTATATGTTCAAAAAAGAGAATAGCAAGAAACCAGTACTCACTTCCGTGGGGAAGAAAGGAATAATGTTGGATAACAATAAAAATGGGGATATAAAATATATATGATAATACATAAAAAAATGACTGATTTTTTAAAATAAAAAAAAGATCGTCACTTTTTGAGTTTATTATCTCTCTAGTACTATAAGTATAAAATTCAAATCCAATAGCAAAAATTGCGTAGCCCACAGCGGCGCTTATAAGACCATAGACTCCCAAATCTGATGATTGCAACAATTTTGCTAATAAAATTATAAACACAAACTTGCTTATCAAAGTAAAGCCACGTATACCTATACTTAAATAATATATAAAAAGAGATTTTTTCATTTGAATAAGCCAATAATGCTTAAAAATATCGTTAACATAATATTAAAAATAGGCCATATACTAATAGATAGCTTTTTAGAAGTTTACAGATCATAGAATGCTTTGAAGCCTAGATTAGCAGGATCATTTGATAAAAATGCTTTAATTATATCCACAATTCTATCTTTTACATTTTCCATAAAATATGGGTTTTTAGAGCTTTCTAGCTTAGAAATAAAAACTTTATCAGTCACACTCGAAATAGCTTCACGTATAGCATTTTTTTCACAAATAGTATCGACAACGCTTTCACCACGAATGCGCC
 >O_4_wzx
 GTGAAAGTTCAATTGTTAAAAATTCCGAGTCATTTAATTGTTGCAGGTTCATCATGGTTATCCAAAATAATAATTGCCGGGGTGCAGTTAGCAAGTATTTCATATCTTATTTCTATGCTAGGTGAAGAGAAATATGCAATCTTTAGTTTGTTAACTGGTTTATTAGTATGGTGTAGCGCTGTTGATTTTGGCATAGGTACAGGACTGCAAAATTATATATCAGAATGCAGAGCCAAAAACAAAAGTTATGATGCATATATTAAATCAGCATTACATCTAAGCTTTATAGCTATTATTTTTTTTATTGCTTTATTTTATATTTTTTCTGGGGTAATTTCCGCTAAATATCTTTCTTCTTTTCATGAGGTATTACAGGACAAAACCAGAATGCTCTTTTTTACCTCATGTCTGGTTTTCAGTTCTATTGGAATCGGAGCTATTGCTTATAAAATACTTTTTGCCGAATTGGTCGGGTGGAAAGCTAATCTATTAAACGCATTATCTTATATGATAGGTATGCTCGGCTTGCTATATATATACTATAGGGGGATCTCAGTTGACATAAAATTATCACTAATAGTCCTGTATCTTCCAGTGGGTATGATTTCATTGTGCTATATTGTATATAGATACATAAAGCTTTATCATGTTAAAACAACAAAATCTCATTATATAGCAATTTTACGTAGATCTTCAGGGTTTTTTCTTTTTACTTTATTATCGATAGTGGTGCTTCAAACAGATTATATGGTCATTTCTCAAAGGCTAACTCCTGCTGATATTGTTCAATATACAGTAACGATGAAAATTTTTGGTTTAGTCTTTTTTATTTATACTGCTATTTTGCAAGCATTATGGCCTATATGTGCTGAATTGAGAGTCAAACAGCAATGGAAAAAACTTAACAAAATGATAGGTGTCAATATTTTGCTTGGCTCACTATATGTTGTTGGATGTACAATATTTATTTATTTATTTAAAGAACAGATATTTTCAGTAATAGCCAAAGATATTAATTATCAAGTTTCTATTTTATCTTTTATGTTAATTGGCATATATTTCTGTATTCGCGTTTGGTGTGACACTTATGCAATGTTATTGCAAAGTATGAATTATTTAAAAATACTTTGGATATTAGTACCACTACAAGCAATAATTGGTGGAATAGCACAATGGTATTTTTCTAGTACGCTTGGAATCAGTGGAGTGCTGCTTGGCTTGATTATATCTTTTGCTTTAACTGTTTTTTGGGGGCTTCCACTAACTTACTTAATTAAGGCAAATAAGGGATAA
 >O_50_wzy


=====================================
database/special_new_O_genes.fasta
=====================================
@@ -104,6 +104,8 @@ ATGATTGAAGGATATGTAGTATATAATAGTATTTTTCTTCTTGCCTTACTATTTGGCTTTATGAAGAATTACTGTCTTCG
 GTGATTATAAAGAAGAATAAATTTGTTTATTCGGTACTTAAAGTCTGGTTAATAGTCTCTTCATTGTATTATTTAAATGCTATTTTTTCCGGTGTTGATGCGTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAATATGTTTTATAATAAGTTTTTTTATTCTGTTCAATAGTAAACGAGTCAAATTTTTGGGGGCTTCGTTATTTTTCATAATCCTTTCGGTAGCTTCAGTAGTTATTGGTAATGTAGTAACGGTATATGCTACCGCGATGCTGATAATTGCTACCATGGTTGGTTTCAGCCAAATTATTCTTTATTTTTCTAATGATATGTCGAAGATTAATATGGTTTTATTATGGACTGGAATTATAATAGGCGCCATTTCTGTATTAGAATTAACAGTATTCTACGATTATATGGTCTCATATTGGGTTTCGACTGGTGGAGTCCGATCAATATCTTCTCTTCTTAATCCTACAAATAGCGGGGCTTATTCAGCGATTATAATTTTAATTGCTTTAGGGACTAATATAAGGAGTAAATTTAAGAGAACTTTATTTGCTTTAATGCCAATGATTACTTTAATCAGCAGCGGATCACGTACAGCATGGTTATCATTAGCATTAACATTATTATTGACGGTATTATTAAATGATAAGGCTAGTATACGATTACGGAAAAAAATATTAGCTATTGCAGGTATTGGAGCTATTTGTGGTGTGTTATATGTAGCATTTTATATGAGTAGTATCTCTGGTATTCAATCCCAACATCGAGGGCTTGATACATATACCGCATCAATTCGAGTTGAAAACTTTATAACATATATGAATTCAATTGATTTTGATATGTTATTACCTGATTTCCTTGATAAAAATATTAACCTTATATCAGATAATTTTTATCTAGTGTTATTAAATTATTTTGGAATTATTGGGGGTTATATTGTTTTTTTTATTTCAGTATTATTATTCTATTATAATATGCAAACAAAGGATTTTGATAAAAATATAGATGAAAGTATTTCTGTTTGGAGAGTGATATTCATCTATTTTCTGATATCTGGACTTTCAAACTCATTCATAAATTCTTTTCCTGTAAACCAACTATTTTTTATCTCATGCGGGTATTATGTGTATAAATATAACTTAATAAAGAAAAATGCTGGAAAGCAAATATGA
 >O-48_wzy-from-blake-2014K-0232
 GTGATAATAAAAAAGTACAAAATTTTTTATTCAGCACTTAAAGTCTGGTTAATAGCCTCTTCATTGTATTATTTAAATGCTATTTTTTTAGGTGTTGATGCTTTAAAATATAATGAAGATTTGACGCAAAAGTTCATCAAATATGCAGTTTGTTTCATCATAAGCATCTATATTCTGATCAATAATAAACGAGTCAAATATCTGTGGGCTTCATTTTTTTTCATAATTCTTTCTGTAGCTTCAGTAGTTATTGATAGTGTTGTAACGGTATATGCAACCACGATGTTGATAATTGCTACCATGCTTGGTTTTAGCCAAATCATTGTTTATTTATCCAATGATATGTCGAGAATTAATATTGTTTTATTATGGACAGGTGTTATTGTAGGCACAATTTCTGTGTTAGAGCTGACTGTGTTCTACGATTATATGGTTTCATATTGGATTTCGACTGGCGGAATTCGATCAATATCTTCCCTTCTGAATCCTACAAATAGTGGAGCTTACTCAGCGATCATAATTTTAATTGCTTTAGCGACTAATATAAAGAATAAGTTTAGGAAAAGTTTATTTGTTTTAATGCCAATGATTACTTTAATCAGTAGTGGATCACGCACCGCATGGTTATCATTAGCATTAACATTGTTATTGACAGTATTGTTAAATGATAAGGCTAGCATACGATTACGGAAAAAAATATTAGCTGTTGCAGGTATTGGAGCTATTTGTGGTCTATTATATGTAGTATTTTATATGAATGCTACCTCTAGCATTCAATCTCAATATCGAGGACTTGATACATATACCGCATCAATTCGGATTGAAAACTTTATATCGTATATAAATTCAATTGATCTTTGCATGTTATTTCCTGATTTTTTTGACAAAAATATTATTCTTATATCAGATAATTTTTACCTTGTTTTATTAAATTATTTTGGGATTATTGGTTTTTATATTATTCTCTTAATGTCAATGTTGCTATTCTATTGTAATGTACAGATAAAGGATTTTAATGATATTATAAATGAAGATATTGCTATTTGGAGAGTAATCTTTATCTATTTTTTGATATCTGGTTTTTCAAACTCATTTATAAGTTCTTTTCCTGTAAACCAGCTATTCTTTATCTCATGCGGGTATTATGTGTATAAATATAAGTTAATAAAAGAAAATGTTGGAAAGTAAATATGA
+>O-48_unknown-from-serveral-cdc-new-genomes
+CTGCAGCAAGCTCCTGAAGCTTATCCCCACCTTGAGCACCAAATTTCCAATTTTGTAAAATGTTACTCTTAAAGTTGCTACAATAATCACACTCTCCACTATTATCAAAAACTATGTTAGGATCAGATGTATCCATAATACAATGGCTACAAACTTTATAACTTTGATTTTCCATGTTCCCCCCTATTTAAAATGACTTTCATAACAATTTCATTAATTTCTTCTGTTTGTACTACATGTAATCCATGAAATAACACTAGTGTTCCCATTTCTTCATATTTATATGCAAGAGTTGATGGATATGAGATAACTACATCAACCTTAGGAAAAAAGTTATCGTCTATAATAAAATTGAATTTAAATTGCCTGACTTTTGAGGAAGCTCTTGCCTTAGGATGCTCTTTATAATAAATAGAACAATTTTCAATTTGTTGATTAATTAGAGAGCAAATTTTTAGCTGACCTTTCTCACACAATGAATGCCCAATAACTAACAATGTTAGCTGGTTCGATGATACTTGAGTAAGGGACAACATAGGTTTACTATATTCCACCTTTATAATTTCGGCCAAATTATAATCCAGTATGTTGTTTATAAACAATTGAAATTCAACTTCATCGAAAACAATTATTTTATCCAAATGCTTTAATTTATATGGTATCTTAAAAAGTAAATAGGCACTTGAATCAAGGGCTCTCAAAGATCCATGCTGGATAAGAGTATATTGAATTCCTTTTTCTCCTAACATTGAATCAATCAGGACCGCCCAACGATCATAATGTTCACTACTTATAACCTTTCCTTGTATTCTATTCATCACTAATGCGACAAGGAACCAAGATGGAGCTGTGTATATTTGCAGGCACCATTTGATAGTATGCTTCGATTTAAAAAAATAGAAAAACGCAAATATGCTTAGCAACATGCTTTTGAAAATATCTAAATACGAAGCCATCTCATAAATTGAAATAACTGTAGCATCACTTCTATCATTACACGATGATAATTTAATAACATTTAACTTTTTTCCATCCGAAATTTTACTATTATAATAATTAATTGCTTGCTCCGTACCTATTTCAGCGAATGAAAAATAGTAAAAGTCGCTTCTATCAATCAATTTATTTTTATCTGTAATTATTTTTTTGTATAATGCAACTATACATTTTAATATAGGATAAAATATAAACCCCCCTAATATGAAGAAAATCATAAGAGAGATATATCCCCCCCACAATTTATGCCTCCCATATGCCCATTTGCTGATCCGAGGTAATGGTGGTATTCTACCTTTCATGCCAGCGATCAACAATTTATCAATAGAGATTTCATTTTCCGTAGCTAACATATAGTAGCGTAAATATGTTTTATAAGAAATTCTCATCCGACATGCCCGTCATTAATAATATGTAGACGCTCTAATTAATAATCAATTATTGACTTTTTTAGAGATATTTGTAACTAGTTAACATGAAAAATTCATATAAAAATGCTAAGTCATCTTCTTATTTATATTTTTCTTGTTGACTAAATAAATTATCGATATAAAAATCATAACTGCTGACGGTGTAAAATACCCAGAACCTCTTAGCAAAAAATATATTATGCTCATTATTAAAACTATACTAAAAAACTTTATTTTTTTGTCATTGCATTTAAACCGCATGACACCTAAAAATAATGTATAAAGAAAAAAAATGCCCCCTAAGATACCAAATTCAACAATCAATTTAGAAATAAATAGTCCACCATCATATAAGTTAGAATCTGTATTCCCTCCCCTTAACCGCCCAATGATTGATACAAACTCTCCTCTTTCATTTGCATATCCCATATTTTGTAAACCATAACCAAGGCCATAGCTATCTCGCAACGCTAGATATGCTTGTTCATATCCAGATAATAAAGTTAATGTTGATGTATTTTTCGATTCTTGGCTTATATCTAATCGTTGCGAATAATAACTTAGTTTATCAATAGGTAAGATTCCAGCAATCAGCATACACGATGAAGATACGCAAATCATAATAATGAACATTGATTTAACTCTCATATAGTTTATAGCTATCGCTACAACAATACCTATAATCAATGTTAAATTCTGGACAATAAGAGCCGTAAATAAAAGAGGAATTCCATAGAGCAAATTTAATTTTTTCTGAGATATCTTATAGCAATAAAAGATTGTAACTATTAGTGCATAATGAGAGGGCTCAGTAAAAAACAACATTTCCTTTGAAGTGCTACTGCTTGATAATATAAAAAGAGATGACAATACCCCCAAAGCTATTAGTAATTTAAATAATTTTGATACTATTCTATCAAACTCCTGGTGAGTAATATTATCAATTGCCACCGATGAAAAATAACATGCGAGTAAAATATAAAATAAGAATAACAATGATGTAATATTCTTAGTGAAAGTAGTATTACCATTCTGAAATAGTAGACTACTTAACCCAAAATGAAACAATATTAGAAAAAAACTAATAACACTAAAAATTAAAAATGAATAACTTATAGTTAATTTATTAAAGCCAGAAATAACCACTAAAAATAATATTATAGTTGATATAAAGAAAATACCAATGAAATTCGAACCAACTTTATCATTTAACACCATTAACAGGCCTGGAACCAGCACCATTCCATAAAAAAATATTGAGGTCAGAACTTTATTAGTATTAAATTGCATTATAGTTAAACCTTATTATTCCTTTTAATTACAATAAAAAATTATATAGCATAAGTATTTTAATTTAAAACAATTAAACTTTTCGTACTTTTCGTAGTTCATGCTTTTAATAATAAACTATGTATCTCACCGAGAAATTCGCTATAACAAACGTAACACTATGCATTTTATATCTATATAAAATACAATAGGTAAGATATCATCTATTAGAATAAAATAAACTCTCGCCGGCAGATCGTCTAATTATAACCAAGAGTTTTATAAACATAGCCAGCTTTAAAAATAATAAAACTGAAAAAGAAATAATCATACCATAAGCAATGTAATTAATATTCGCGACCTTAAGTGCAATATAAAGAAAAGATGAAAACAGTAAAAAAGTTAAACACTGGCTCCAGACTATCATTTTATCTTTTCTTAGTGCATACAGACCCAGATGTGGTATAAGGCTTAAACAATATATAAACGTCGCCACAATTAGCAACTGAAATAGTGGAAGTAATTCCCAATATTCGATCTTTCCAATCCACTGAATGAGGATATAACCGGTAAAAAAACAACAAATACATAACAGAAGCGACACTGCTATTAATTTGAATGCGAATGACTTCATTCCAGCGATGAATCCAATGTAGTCCTTTCGATAACACAATTTTGCCAATTTTGGGAATGAAAAAGATATTAGGATCGTATCGAGGAAAGATTGTATAGCCGCCGTCATACTAATAAACAAAGTATATACACCAAGGATCTTTAGTCCAGCAATATGTTCAACGGCAAACCTATCAAATGTAAAAAAACCTCTGAGCGCCAAAGCGGCAATTAGCATTGGTGCGGAAAGGATAATTCCTCTCATTATCCAGCGCCAGCTAAATGGCGATGTAAACTTCCGTTTATTATTTTTTAGAATATAAAAAAAGCCCATTGCACTAGCACAGAATGTACCAAATAGCCATAATGTAAATACAATAAATAGATTTCTTGACGTAGGAAATAATAGCATAATGGCTATCACGAGCCAGCACCAAAGTCCTTGTCGTATAAACAACACAAGACTTGCGAAAGCTTGATTCTCGAGAGTTATTAATATTCTATTAATTTCTTGAGCTATATGTTCAAAAAAGAGAATAGCAAGAAACCAGTACTCACTTCCGTGGGGAAGAAAGGAATAATGTTGGATAACAATAAAAATGGGGATATAAAATATATATGATAATACATAAAAAAATGACTGATTTTTTAAAATAAAAAAAAGATCGTCACTTTTTGAGTTTATTATCTCTCTAGTACTATAAGTATAAAATTCAAATCCAATAGCAAAAATTGCGTAGCCCACAGCGGCGCTTATAAGACCATAGACTCCCAAATCTGATGATTGCAACAATTTTGCTAATAAAATTATAAACACAAACTTGCTTATCAAAGTAAAGCCACGTATACCTATACTTAAATAATATATAAAAAGAGATTTTTTCATTTGAATAAGCCAATAATGCTTAAAAATATCGTTAACATAATATTAAAAATAGGCCATATACTAATAGATAGCTTTTTAGAAGTTTACAGATCATAGAATGCTTTGAAGCCTAGATTAGCAGGATCATTTGATAAAAATGCTTTAATTATATCCACAATTCTATCTTTTACATTTTCCATAAAATATGGGTTTTTAGAGCTTTCTAGCTTAGAAATAAAAACTTTATCAGTCACACTCGAAATAGCTTCACGTATAGCATTTTTTTCACAAATAGTATCGACAACGCTTTCACCACGAATGCGCC
 >O-4_wzx
 GTGAAAGTTCAATTGTTAAAAATTCCGAGTCATTTAATTGTTGCAGGTTCATCATGGTTATCCAAAATAATAATTGCCGGGGTGCAGTTAGCAAGTATTTCATATCTTATTTCTATGCTAGGTGAAGAGAAATATGCAATCTTTAGTTTGTTAACTGGTTTATTAGTATGGTGTAGCGCTGTTGATTTTGGCATAGGTACAGGACTGCAAAATTATATATCAGAATGCAGAGCCAAAAACAAAAGTTATGATGCATATATTAAATCAGCATTACATCTAAGCTTTATAGCTATTATTTTTTTTATTGCTTTATTTTATATTTTTTCTGGGGTAATTTCCGCTAAATATCTTTCTTCTTTTCATGAGGTATTACAGGACAAAACCAGAATGCTCTTTTTTACCTCATGTCTGGTTTTCAGTTCTATTGGAATCGGAGCTATTGCTTATAAAATACTTTTTGCCGAATTGGTCGGGTGGAAAGCTAATCTATTAAACGCATTATCTTATATGATAGGTATGCTCGGCTTGCTATATATATACTATAGGGGGATCTCAGTTGACATAAAATTATCACTAATAGTCCTGTATCTTCCAGTGGGTATGATTTCATTGTGCTATATTGTATATAGATACATAAAGCTTTATCATGTTAAAACAACAAAATCTCATTATATAGCAATTTTACGTAGATCTTCAGGGTTTTTTCTTTTTACTTTATTATCGATAGTGGTGCTTCAAACAGATTATATGGTCATTTCTCAAAGGCTAACTCCTGCTGATATTGTTCAATATACAGTAACGATGAAAATTTTTGGTTTAGTCTTTTTTATTTATACTGCTATTTTGCAAGCATTATGGCCTATATGTGCTGAATTGAGAGTCAAACAGCAATGGAAAAAACTTAACAAAATGATAGGTGTCAATATTTTGCTTGGCTCACTATATGTTGTTGGATGTACAATATTTATTTATTTATTTAAAGAACAGATATTTTCAGTAATAGCCAAAGATATTAATTATCAAGTTTCTATTTTATCTTTTATGTTAATTGGCATATATTTCTGTATTCGCGTTTGGTGTGACACTTATGCAATGTTATTGCAAAGTATGAATTATTTAAAAATACTTTGGATATTAGTACCACTACAAGCAATAATTGGTGGAATAGCACAATGGTATTTTTCTAGTACGCTTGGAATCAGTGGAGTGCTGCTTGGCTTGATTATATCTTTTGCTTTAACTGTTTTTTGGGGGCTTCCACTAACTTACTTAATTAAGGCAAATAAGGGATAA
 >O-50_wzy


=====================================
libs/BWA_analysis_H_update_new_family_dependent.py
=====================================
@@ -72,12 +72,16 @@ def BWA_analysis(sra_name,additional_file,database,mapping_mode,file_mode,z):
       os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
       os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
       os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
+    elif mapping_mode=="nanopore":
+      os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
   else:
     if mapping_mode=="mem":
       os.system("bwa mem database/"+database+" "+for_fq+" > "+sam) #2014/12/23
     elif mapping_mode=="sam":
       os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
       os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
+    elif mapping_mode=="nanopore":
+      os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam) 
   os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
   os.system("samtools view -h -o "+sam+" "+bam)
   file=open(sam,"r")
@@ -376,12 +380,16 @@ def assembly(type,sra_name,for_fq,rev_fq,for_sai,rev_sai,sam,bam,database,databa
       os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
       os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
       os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
+    elif mapping_mode=="nanopore":
+      os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam) 
   else:
     if mapping_mode=="mem":
       os.system("bwa mem database/"+database+" "+for_fq+" > "+sam) #2014/12/23
     elif mapping_mode=="sam":
       os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
       os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
+    elif mapping_mode=="nanopore":
+      os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)
   
   os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
   os.system("samtools view -h -o "+sam+" "+bam)


=====================================
libs/BWA_analysis_O_new_dependent.py
=====================================
@@ -93,12 +93,16 @@ def BWA_O_analysis(sra_name,additional_file,database,mapping_mode,file_mode):
       os.system("bwa sampe "+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
     elif mapping_mode=="mem":
       os.system("bwa mem "+database+" "+for_fq+" "+rev_fq+" > "+sam) #2014/12/23
+    elif mapping_mode=="nanopore": ##
+      os.system("bwa mem -x ont2d "+database+" "+for_fq+" "+rev_fq+" > "+sam)##
   else:
     if mapping_mode=="mem":
       os.system("bwa mem "+database+" "+for_fq+" > "+sam) #2014/12/23
     elif mapping_mode=="sam":
       os.system("bwa aln "+database+" "+for_fq+" > "+for_sai)
       os.system("bwa samse "+database+" "+for_sai+" "+for_fq+" > "+sam)
+    elif mapping_mode=="nanopore":##
+      os.system("bwa mem -x ont2d "+database+" "+for_fq+" > "+sam)##
   os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
   os.system("samtools view -h -o "+sam+" "+bam)
 
@@ -150,6 +154,7 @@ def BWA_O_analysis(sra_name,additional_file,database,mapping_mode,file_mode):
         if "sdf" in x[0] and x[1]>3:#
           qq=0#
           print "$$$",x[0],"got a hit, reads:",x[1]#
+          final_O.remove(x)
       if qq!=0:#
         print "$$$No sdf exists"#
 
@@ -194,6 +199,8 @@ def assembly(sra_name,potential_choice,for_fq,rev_fq,for_sai,rev_sai,sam,bam,map
     elif mapping_mode=="sam":
       os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
       os.system("bwa samse database/"+database+" "+for_sai+" "+for_fq+" > "+sam)
+    elif mapping_mode=="nanopore":##
+      os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" > "+sam)##
   else:
     if mapping_mode=="mem":
       os.system("bwa mem database/"+database+" "+for_fq+" "+rev_fq+" > "+sam) #2014/12/23
@@ -201,6 +208,8 @@ def assembly(sra_name,potential_choice,for_fq,rev_fq,for_sai,rev_sai,sam,bam,map
       os.system("bwa aln database/"+database+" "+for_fq+" > "+for_sai)
       os.system("bwa aln database/"+database+" "+rev_fq+" > "+rev_sai)
       os.system("bwa sampe database/"+database+" "+for_sai+" "+ rev_sai+" "+for_fq+" "+rev_fq+" > "+sam)
+    elif mapping_mode=="nanopore":
+      os.system("bwa mem -x ont2d database/"+database+" "+for_fq+" "+rev_fq+" > "+sam)
   os.system("samtools view -F 4 -Sbh "+sam+" > "+bam)
   os.system("samtools view -h -o "+sam+" "+bam)
   os.system("cat "+sam+"|awk '{if ($5>0) {print $10}}'>"+sam+"_seq.txt")


=====================================
libs/split_interleaved_fastq.pl
=====================================



View it on GitLab: https://salsa.debian.org/med-team/seqsero/commit/38260da97f64fa5c2994582cbc479aa2f8ec5f34

-- 
View it on GitLab: https://salsa.debian.org/med-team/seqsero/commit/38260da97f64fa5c2994582cbc479aa2f8ec5f34
You're receiving this email because of your account on salsa.debian.org.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://alioth-lists.debian.net/pipermail/debian-med-commit/attachments/20180903/c9db533d/attachment-0001.html>


More information about the debian-med-commit mailing list