Corchorus golden mosaic virus

Basic Information

Genus	Begomovirus
NCBI Assembly	GCF_000873405.1
Isolate	Viet Nam: Hanoi
Release date	2015/2/13
Submitter	Ha,C., Coombs,S., Revill,P., Harding,R., Vu,M., Dale,J., Ha,C.V., Revill,P.A., Harding,R.M., Vu,M.T., Dale,J.L.
Host	Corchorus capsularis
Vector	Bemisia tabaci
Download	Genome \|GFF3 \|PEP \|CDS

Genomic Organization

JBrowse

Genome

NC_009644

ACCGTGCAGCAGCCGCCGCTTTTTCCGTACACTTTAATTTAAAATGAAATTGAAATTGATTGGAACTTTACTTTAGATGTGGCCAATGATATAACACGTGGTGGGTCATTTTAGACGCTTTTATCCTTATGACATAAGTTTCAATTTCATTTGAACTTTATAGCGCTATAAATTTAAATTTGAATGAATTTCAAGTACTGTCAGTGTTATAGTTCGAAAAGATGATGAAACGTGAGGCCCCATGGCGTACGAATGCTGGGACCTCCAAGGTACGTCGCGCTTTAAATTTCTCCCCTCGTAGTGGATTGGGCCCAAAAGCGTCTGCTTGGGTTAATCGGCCCATGTATAGAAAGCCCAGGATTTATCGAACGTATAGATCACCTGATGTTCCAAAGGGCTGTGAAGGCCCTTGTAAGGTACAGTCATTTGAACAGCGTCACGACATTTCTCATGTCGGCAAGGTCATGTGTATATCCGATGTCACACGTGGTAATGGTATCACGCATCGTGTTGGTAAACGTTTTTGTATTAAGTCTGTTTATATCCTAGGTAAAGTATGGATGGACGATAATATTAAACTTAAGAACCACACTAACAGTGTTATGTTCTGGTTAGTTAGGGATAGGAGACCGTATGGTACTCCCATGGATTTTGGACAGGTTTTTAACATGTATGATAACGAGCCGAGTACCGCTACTATCAAGAACGATCTCCGTGATCGTTACCAGGTTTTGCATAGGTTTGCGTCGAAGGTTACTGGTGGACAGTATGCTAGCAACGAACAGTCTCTTGTGAGACGATTCTGGAAGGTGAACAACCATGTGGTGTACAACCATCAAGAAGCTGCTAAGTACGATAATCACACTGAGAATGCATTATTATTGTATATGGCATGTACTCATGCCTCTAATCCTGTGTATGCTACTTTAAAGATACGGATCTATTTCTATGATTCGATATCAAATTAATAAATATTGAATTTTATTATATGATTTTCTTCTTCAACATGTACATATACGAGCGTATCAGCAGCATGTGCAATCGCTCTAATTACATTGTTTATGCCAATGGCACCTAAATCATCTAAGTAACGTCTAATTCGGGAAGAAAATACTTGAAAGAAACTCGAAATCCTCCATCTGGAGGTCGTCCGAACCCTGAAATTCAGGTAGCACTTGTGGAGCTGAAGTGCTTTCCTCAGGTTGTGGTTGAATCTTATCTGCAGCAATAGTAGGTGTCTCGCACCTAGATCTGTGACAGATATTATCTTGAAATAGAGGGGATTTGGAACCCTCCAAGTAAAAACGGAACTCTCTGCCTGATATGCAGTGATGGGATCCCCTGTGCGTAAATCCATCGTCTCTGCAGTGGATGCTCACATATATGGAGCAACCGCATTCCAGGTCAATTCGTCTCCGACGAATTACTTTCTTCGAGTGCCGATGTCGATTCTTGATTTGTGGTATTAAAGAATGGCTCTTCGATGGTGACGTAGATGACGTTTTTTTTGGCCCAGTCATTGATTGCTTTGTTCTTTTCCTCTTCGAAGAACTCCTTATATGATGAAGTAGGCCCAGGATTGCAGAGGAAGATTGTTGGAATCCCTCCATTTATTTGAATTGGTTTGCCGTACTTGCAGTTGGACTGCCAGTCTCTCTGGGCCCCCATAAATTCCTTCATATGCTTTAGATAGTGCGGGTCGACATCATCAATGACGTTGTACCAGGCCTCATTTGAATACACTTTTGGGCTTAGATCAAGATGTCCACAAAGATAATTGTGACGACCCAAACTTCTGGCCCATAATGTTTTCCCTGTCCTAGATGGACCTTCAATGATAATAGATATCGGCCTAAAGGGCCGCGCAGCGGCATCCATTATATTATCGTTAACCCACTGATTAATAACAGCAGGAACGTTATTAAACGATGATAGTGGGAACGGTGGCTCAAAAACATTAACTGGAGGAGCAAAGATCCTCTCCAAATTTTGATTAAGATTATGAAATTGTAATACATAATCCTTTGGAACTAACTCCTTAATGATATTAAGAGCCTCGTCCTTACTTCCGCTGTTAAGCGCCTTTGCATAAGCCTCATTAACTGTCTGTTGACCGCCTCTCGCCGATCTTCCGTCCACCTGGAAAGTGCCCCATTCGCAGAACACTCCATCTTTTTCGATATATGATTTGGCGTCGGAGGAGGAGCGCGCAGTTTCAATGTGACAGTGGAATTGACGTGAGTTCTGTGGATGGGAGAGGTCGAATAATCGACAATTTGTGCAGATGAATTTTTTCTGGAATTGAACCAAGGCATGCAGGTGAGGCGACCCATCTTGATGTTTTTCCTCACAGACTCTAATATAAACGATGTTGGTTGGAAGGGTTAATGCTTGTATTTGGTCTAAGGCTGACTCTTTAGTAACTGGGCATTTTGGCCACGTGAGGAAAAAAGAAACGCCTTGTTTCTTAAAACGACCGCTCATCTTGCGTTTTAAATCGGGGACAATCAAAGTCTCTGATATCCGATATATCGGGGACAATATATAGGTCTCCCAATATTTGTACTAAGAGCGTGCAGAGCCTTTTTATACGGACGCGAAGGGCATTATAGTCATTTCCCTTAGTAATTCAGCGTGTTTTTTGGGTTCCAATCCGCTGCTGCACGCTCCTATTATT

NC_009646

ACCGTGCAGCAGCCGCCGCTTTTTCCGTACACTTTAATTTGAATTGGGCTCCAGTTATTGAAAGCGACGTTTATAAACAAGTGGCCACGATTGCGCCACGTGTTGCAATAATAGCCATGGATAAAAATTATATGTGAGCCACGCGATATTTATCCAAAATTGAAAAAAAAGACCGCGCGTTCATGGATGATAATATTGGATTAACTAATTTTAGAAATGATTTCGTCCAATCATTGATTGACATTGGGGTTTCATTATAACTGAATGGCATCATCCAACTATAAATAACAGAAAATTGTTTAAAAGATAAATTAGCCTGTGATATTTTTTTTTTGTTTGTAAATATGTATATTGGTAAAGGTATACGTTATAGCAACAACACCATGAATCGTGCTAAGTACAACAGACCTGTTGGTCGTCGATCTTTTGTGTATAGGCGCGGTCCTAAAGTACGTGTTAATCAGTCTGTCCCAAAGTCACAGGGTGACAAGATGACCAGACAGCGTATCCATGAAAATCAGTATGGCGTACAGTATTCCCTATTAAACAATACGTCCAGTGTGTCTTTTATCACATATCCTAGATTAGGTGGGCCTGAGCCCAATAGAAGTCGGGCTTACATAAAATTGAATAGGCTTCGTTACAAGGGGACTGTTAATATTGAATGTTCAGATCCAGATGTTGGAATGGATCCCAATCGTGGTGGGCTTTCTGGTGTCTTCACTCTGGCTATTGTTGTTGATAGGAAACCTCATGTTGGACCTACTGGTTCATTGCCATCATTTGACGATCTGTTTGGTTGTAATCTGTACAGCAATGGGAGCCTTGATATCTCACCCCAGATGAAGCAGCGTTACTACATTCGGCACGTACACAAACGTGTCGTATCTTATGAGAAGGATTCTATCATGATGAACATATCGGGCAATATGGGATTATCTTCCCCTAAATATGTATGTTGGTCCTCATTCAAGGACCTTGATGTGGATAGTTGTACTGGGAGCTATTCTAATCTAGCTAAGAATGCTCTTTTAGTTTATTATTGTTGGGTTTCGAACATGCCTTCTAAGGCATCATCATTTGTATCTTTTGACCTGGATTATCTGGGTTAAATTAATAAAAATATATTTGCAATAATAAGAATTGTTTGAAATTGGTAATTGCATTTATAATTCATAATGGTTTAGCCTGTTGAGGCGTACAATTTCTATTAATGCATAAATCGACAGTGCTATTGACAAGTTCTTGTAATTGTGCCCTGCTAAGTGTGATGTTGGACTCGGACCGCGCAGCTGCAACCAGTGATGCCGAGTCACCTGGGTCTAGCATGCTTGTGCTCAGCCTGTGAAGCTCTCTGTATGGGTGTCTGTTATGGGCTACGTCGGACTCTGTCTCGTTAATGTCCACTCCAACTGAGCTCCTTGTGGCCCAAGATTCACCGGGCCTTAGTTCGATTGCCGAATGGAGGGCTGACCTTGATGATGAAGCTGATTTGATCAGCTTCCTCTCGACCTTCCCATATTCCACATGGGAGAAGTCTATATCTTTCCCGGTGAACTGCTTAGATAGTATCTTCACGGTGGGAGAGCGAAAAACGACATCAACGGAGTGCTTGGCTGTGGACATCTTCAGCTTGCCCTTGAACTTGGCGAAATGTGTTCCCTGGTTGACATTAGTGTCTGACACCCTGTAGTACAGCTTCCATGGAATAGGATCCTTGAGTGAGAAGAAGGATGCAGAGAAGTAGTGGAGATCAATGTTGCATCTAATTGGGAAGGTGTATGTCGTCTGTAATGACTCGTTGTCATTCATGCGTGTGTCATGAATCTCGACAATTACTGAGCCAGAAGCGTTAATTGGCACCTGTTGTCTGTACTCGATGACACAATGATCTATCTTCATGCACCTCCTCCTTACAGTTGCACCCCATTGTTCTGCAGTTGATGGGAATTGCAGCACAATCTCTGTGAGATCATGGGTGAGTCTGTACTCGTCTCTATTAGACTCAATATAATTAAAAGAATTGGGAGCGTTAGCTAATTGAGAACTCATGAGGAGATGTTGGTCGCGCAGCGAAACCAGAAAAAATTGTTATGGATGATAAACTAATGACTGAAGAAATGAGACATTATTTGTCTGAGATAATGAAGAGGATAGTCTGTTCATAAGAACATCTGGGTATGGTGTTTGCGTTTTGCGATGGAACTGGTTATATAGACAGATAGATGTACGGATCTAATTGGAGACAACATTCTCTCTCTTTCTCTCTCATCTCTCTCATCTCTCTCTTAATTTCAATTAAATCTTGCTTAATTACGGATAATGATGTTGTTATTATTAAGAGAGATGTTATTAAGAATGATATAATCTCGGACTTTCTATTTTAAATGAAACGACAATCGACTCTGCGTTTTAAATCGGGGACAATCAAAGTCTCTGATATCCGATATATCGGGGACAATATATAGGTCTCCCAATTTATTGGTACGGGAGTCAGCAGCGACATAGACCCTAAACTTCGAGGGCAAGTTGTGTCTTTTCACTATTCAACAAAGGAAAGGACAAATAAAAGTCAGGGGTATTTTGGGTATTTCACTTTATAGTGGCAAAATGGTAAATAACACACCGCTGCTGCACGACCCTATTATT

Gene Information

NCBI Accession	YP_001333684.1
Location	225-968
Gene Name	AV1
Protein Name	CP protein
Coding Region	ATGAAACGTGAGGCCCCATGGCGTACGAATGCTGGGACCTCCAAGGTACGTCGCGCTTTAAATTTCTCCCCTCGTAGTGGATTGGGCCCAAAAGCGTCTGCTTGGGTTAATCGGCCCATGTATAGAAAGCCCAGGATTTATCGAACGTATAGATCACCTGATGTTCCAAAGGGCTGTGAAGGCCCTTGTAAGGTACAGTCATTTGAACAGCGTCACGACATTTCTCATGTCGGCAAGGTCATGTGTATATCCGATGTCACACGTGGTAATGGTATCACGCATCGTGTTGGTAAACGTTTTTGTATTAAGTCTGTTTATATCCTAGGTAAAGTATGGATGGACGATAATATTAAACTTAAGAACCACACTAACAGTGTTATGTTCTGGTTAGTTAGGGATAGGAGACCGTATGGTACTCCCATGGATTTTGGACAGGTTTTTAACATGTATGATAACGAGCCGAGTACCGCTACTATCAAGAACGATCTCCGTGATCGTTACCAGGTTTTGCATAGGTTTGCGTCGAAGGTTACTGGTGGACAGTATGCTAGCAACGAACAGTCTCTTGTGAGACGATTCTGGAAGGTGAACAACCATGTGGTGTACAACCATCAAGAAGCTGCTAAGTACGATAATCACACTGAGAATGCATTATTATTGTATATGGCATGTACTCATGCCTCTAATCCTGTGTATGCTACTTTAAAGATACGGATCTATTTCTATGATTCGATATCAAATTAA
Protein Sequence	MKREAPWRTNAGTSKVRRALNFSPRSGLGPKASAWVNRPMYRKPRIYRTYRSPDVPKGCEGPCKVQSFEQRHDISHVGKVMCISDVTRGNGITHRVGKRFCIKSVYILGKVWMDDNIKLKNHTNSVMFWLVRDRRPYGTPMDFGQVFNMYDNEPSTATIKNDLRDRYQVLHRFASKVTGGQYASNEQSLVRRFWKVNNHVVYNHQEAAKYDNHTENALLLYMACTHASNPVYATLKIRIYFYDSISN

NCBI Accession	YP_001333685.1
Location	965-1357
Gene Name	AC3
Protein Name	REn protein
Coding Region	ATGGATTTACGCACAGGGGATCCCATCACTGCATATCAGGCAGAGAGTTCCGTTTTTACTTGGAGGGTTCCAAATCCCCTCTATTTCAAGATAATATCTGTCACAGATCTAGGTGCGAGACACCTACTATTGCTGCAGATAAGATTCAACCACAACCTGAGGAAAGCACTTCAGCTCCACAAGTGCTACCTGAATTTCAGGGTTCGGACGACCTCCAGATGGAGGATTTCGAGTTTCTTTCAAGTATTTTCTTCCCGAATTAGACGTTACTTAGATGATTTAGGTGCCATTGGCATAAACAATGTAATTAGAGCGATTGCACATGCTGCTGATACGCTCGTATATGTACATGTTGAAGAAGAAAATCATATAATAAAATTCAATATTTATTAA
Protein Sequence	MDLRTGDPITAYQAESSVFTWRVPNPLYFKIISVTDLGARHLLLLQIRFNHNLRKALQLHKCYLNFRVRTTSRWRISSFFQVFSSRIRRYLDDLGAIGINNVIRAIAHAADTLVYVHVEEENHIIKFNIY

NCBI Accession	YP_001333686.1
Location	1095-1610
Gene Name	AC2
Protein Name	TrAP protein
Coding Region	ATGGAGGGATTCCAACAATCTTCCTCTGCAATCCTGGGCCTACTTCATCATATAAGGAGTTCTTCGAAGAGGAAAAGAACAAAGCAATCAATGACTGGGCCAAAAAAAACGTCATCTACGTCACCATCGAAGAGCCATTCTTTAATACCACAAATCAAGAATCGACATCGGCACTCGAAGAAAGTAATTCGTCGGAGACGAATTGACCTGGAATGCGGTTGCTCCATATATGTGAGCATCCACTGCAGAGACGATGGATTTACGCACAGGGGATCCCATCACTGCATATCAGGCAGAGAGTTCCGTTTTTACTTGGAGGGTTCCAAATCCCCTCTATTTCAAGATAATATCTGTCACAGATCTAGGTGCGAGACACCTACTATTGCTGCAGATAAGATTCAACCACAACCTGAGGAAAGCACTTCAGCTCCACAAGTGCTACCTGAATTTCAGGGTTCGGACGACCTCCAGATGGAGGATTTCGAGTTTCTTTCAAGTATTTTCTTCCCGAATTAG
Protein Sequence	MEGFQQSSSAILGLLHHIRSSSKRKRTKQSMTGPKKTSSTSPSKSHSLIPQIKNRHRHSKKVIRRRRIDLECGCSIYVSIHCRDDGFTHRGSHHCISGREFRFYLEGSKSPLFQDNICHRSRCETPTIAADKIQPQPEESTSAPQVLPEFQGSDDLQMEDFEFLSSIFFPN

NCBI Accession	YP_001333687.1
Location	1405-2484
Gene Name	AC1
Protein Name	rep protein
Coding Region	ATGAGCGGTCGTTTTAAGAAACAAGGCGTTTCTTTTTTCCTCACGTGGCCAAAATGCCCAGTTACTAAAGAGTCAGCCTTAGACCAAATACAAGCATTAACCCTTCCAACCAACATCGTTTATATTAGAGTCTGTGAGGAAAAACATCAAGATGGGTCGCCTCACCTGCATGCCTTGGTTCAATTCCAGAAAAAATTCATCTGCACAAATTGTCGATTATTCGACCTCTCCCATCCACAGAACTCACGTCAATTCCACTGTCACATTGAAACTGCGCGCTCCTCCTCCGACGCCAAATCATATATCGAAAAAGATGGAGTGTTCTGCGAATGGGGCACTTTCCAGGTGGACGGAAGATCGGCGAGAGGCGGTCAACAGACAGTTAATGAGGCTTATGCAAAGGCGCTTAACAGCGGAAGTAAGGACGAGGCTCTTAATATCATTAAGGAGTTAGTTCCAAAGGATTATGTATTACAATTTCATAATCTTAATCAAAATTTGGAGAGGATCTTTGCTCCTCCAGTTAATGTTTTTGAGCCACCGTTCCCACTATCATCGTTTAATAACGTTCCTGCTGTTATTAATCAGTGGGTTAACGATAATATAATGGATGCCGCTGCGCGGCCCTTTAGGCCGATATCTATTATCATTGAAGGTCCATCTAGGACAGGGAAAACATTATGGGCCAGAAGTTTGGGTCGTCACAATTATCTTTGTGGACATCTTGATCTAAGCCCAAAAGTGTATTCAAATGAGGCCTGGTACAACGTCATTGATGATGTCGACCCGCACTATCTAAAGCATATGAAGGAATTTATGGGGGCCCAGAGAGACTGGCAGTCCAACTGCAAGTACGGCAAACCAATTCAAATAAATGGAGGGATTCCAACAATCTTCCTCTGCAATCCTGGGCCTACTTCATCATATAAGGAGTTCTTCGAAGAGGAAAAGAACAAAGCAATCAATGACTGGGCCAAAAAAAACGTCATCTACGTCACCATCGAAGAGCCATTCTTTAATACCACAAATCAAGAATCGACATCGGCACTCGAAGAAAGTAATTCGTCGGAGACGAATTGA
Protein Sequence	MSGRFKKQGVSFFLTWPKCPVTKESALDQIQALTLPTNIVYIRVCEEKHQDGSPHLHALVQFQKKFICTNCRLFDLSHPQNSRQFHCHIETARSSSDAKSYIEKDGVFCEWGTFQVDGRSARGGQQTVNEAYAKALNSGSKDEALNIIKELVPKDYVLQFHNLNQNLERIFAPPVNVFEPPFPLSSFNNVPAVINQWVNDNIMDAAARPFRPISIIIEGPSRTGKTLWARSLGRHNYLCGHLDLSPKVYSNEAWYNVIDDVDPHYLKHMKEFMGAQRDWQSNCKYGKPIQINGGIPTIFLCNPGPTSSYKEFFEEEKNKAINDWAKKNVIYVTIEEPFFNTTNQESTSALEESNSSETN

NCBI Accession	YP_001333688.1
Location	2031-2333
Gene Name	AC4
Protein Name	AC4 protein
Coding Region	ATGGGTCGCCTCACCTGCATGCCTTGGTTCAATTCCAGAAAAAATTCATCTGCACAAATTGTCGATTATTCGACCTCTCCCATCCACAGAACTCACGTCAATTCCACTGTCACATTGAAACTGCGCGCTCCTCCTCCGACGCCAAATCATATATCGAAAAAGATGGAGTGTTCTGCGAATGGGGCACTTTCCAGGTGGACGGAAGATCGGCGAGAGGCGGTCAACAGACAGTTAATGAGGCTTATGCAAAGGCGCTTAACAGCGGAAGTAAGGACGAGGCTCTTAATATCATTAAGGAGTTAG
Protein Sequence	MGRLTCMPWFNSRKNSSAQIVDYSTSPIHRTHVNSTVTLKLRAPPPTPNHISKKMECSANGALSRWTEDRREAVNRQLMRLMQRRLTAEVRTRLLISLRS

NCBI Accession	YP_001333689.1
Location	345-1112
Gene Name	BV1
Protein Name	NSP protein
Coding Region	ATGTATATTGGTAAAGGTATACGTTATAGCAACAACACCATGAATCGTGCTAAGTACAACAGACCTGTTGGTCGTCGATCTTTTGTGTATAGGCGCGGTCCTAAAGTACGTGTTAATCAGTCTGTCCCAAAGTCACAGGGTGACAAGATGACCAGACAGCGTATCCATGAAAATCAGTATGGCGTACAGTATTCCCTATTAAACAATACGTCCAGTGTGTCTTTTATCACATATCCTAGATTAGGTGGGCCTGAGCCCAATAGAAGTCGGGCTTACATAAAATTGAATAGGCTTCGTTACAAGGGGACTGTTAATATTGAATGTTCAGATCCAGATGTTGGAATGGATCCCAATCGTGGTGGGCTTTCTGGTGTCTTCACTCTGGCTATTGTTGTTGATAGGAAACCTCATGTTGGACCTACTGGTTCATTGCCATCATTTGACGATCTGTTTGGTTGTAATCTGTACAGCAATGGGAGCCTTGATATCTCACCCCAGATGAAGCAGCGTTACTACATTCGGCACGTACACAAACGTGTCGTATCTTATGAGAAGGATTCTATCATGATGAACATATCGGGCAATATGGGATTATCTTCCCCTAAATATGTATGTTGGTCCTCATTCAAGGACCTTGATGTGGATAGTTGTACTGGGAGCTATTCTAATCTAGCTAAGAATGCTCTTTTAGTTTATTATTGTTGGGTTTCGAACATGCCTTCTAAGGCATCATCATTTGTATCTTTTGACCTGGATTATCTGGGTTAA
Protein Sequence	MYIGKGIRYSNNTMNRAKYNRPVGRRSFVYRRGPKVRVNQSVPKSQGDKMTRQRIHENQYGVQYSLLNNTSSVSFITYPRLGGPEPNRSRAYIKLNRLRYKGTVNIECSDPDVGMDPNRGGLSGVFTLAIVVDRKPHVGPTGSLPSFDDLFGCNLYSNGSLDISPQMKQRYYIRHVHKRVVSYEKDSIMMNISGNMGLSSPKYVCWSSFKDLDVDSCTGSYSNLAKNALLVYYCWVSNMPSKASSFVSFDLDYLG

NCBI Accession	YP_001333690.1
Location	1174-2052
Gene Name	BC1
Protein Name	MP protein
Coding Region	ATGAGTTCTCAATTAGCTAACGCTCCCAATTCTTTTAATTATATTGAGTCTAATAGAGACGAGTACAGACTCACCCATGATCTCACAGAGATTGTGCTGCAATTCCCATCAACTGCAGAACAATGGGGTGCAACTGTAAGGAGGAGGTGCATGAAGATAGATCATTGTGTCATCGAGTACAGACAACAGGTGCCAATTAACGCTTCTGGCTCAGTAATTGTCGAGATTCATGACACACGCATGAATGACAACGAGTCATTACAGACGACATACACCTTCCCAATTAGATGCAACATTGATCTCCACTACTTCTCTGCATCCTTCTTCTCACTCAAGGATCCTATTCCATGGAAGCTGTACTACAGGGTGTCAGACACTAATGTCAACCAGGGAACACATTTCGCCAAGTTCAAGGGCAAGCTGAAGATGTCCACAGCCAAGCACTCCGTTGATGTCGTTTTTCGCTCTCCCACCGTGAAGATACTATCTAAGCAGTTCACCGGGAAAGATATAGACTTCTCCCATGTGGAATATGGGAAGGTCGAGAGGAAGCTGATCAAATCAGCTTCATCATCAAGGTCAGCCCTCCATTCGGCAATCGAACTAAGGCCCGGTGAATCTTGGGCCACAAGGAGCTCAGTTGGAGTGGACATTAACGAGACAGAGTCCGACGTAGCCCATAACAGACACCCATACAGAGAGCTTCACAGGCTGAGCACAAGCATGCTAGACCCAGGTGACTCGGCATCACTGGTTGCAGCTGCGCGGTCCGAGTCCAACATCACACTTAGCAGGGCACAATTACAAGAACTTGTCAATAGCACTGTCGATTTATGCATTAATAGAAATTGTACGCCTCAACAGGCTAAACCATTATGA
Protein Sequence	MSSQLANAPNSFNYIESNRDEYRLTHDLTEIVLQFPSTAEQWGATVRRRCMKIDHCVIEYRQQVPINASGSVIVEIHDTRMNDNESLQTTYTFPIRCNIDLHYFSASFFSLKDPIPWKLYYRVSDTNVNQGTHFAKFKGKLKMSTAKHSVDVVFRSPTVKILSKQFTGKDIDFSHVEYGKVERKLIKSASSSRSALHSAIELRPGESWATRSSVGVDINETESDVAHNRHPYRELHRLSTSMLDPGDSASLVAAARSESNITLSRAQLQELVNSTVDLCINRNCTPQQAKPL