Corchorus golden mosaic virus
Basic Information
Genus |
Begomovirus
|
NCBI Assembly |
GCF_000873405.1 |
Isolate |
Viet Nam: Hanoi |
Release date |
2015/2/13 |
Submitter |
Ha,C., Coombs,S., Revill,P., Harding,R., Vu,M., Dale,J., Ha,C.V., Revill,P.A., Harding,R.M., Vu,M.T., Dale,J.L. |
Host |
|
Vector |
|
Download |
Genome
|GFF3
|PEP
|CDS |
Genomic Organization
JBrowse
Genome
ACCGTGCAGCAGCCGCCGCTTTTTCCGTACACTTTAATTTAAAATGAAATTGAAATTGATTGGAACTTTACTTTAGATGTGGCCAATGATATAACACGTGGTGGGTCATTTTAGACGCTTTTATCCTTATGACATAAGTTTCAATTTCATTTGAACTTTATAGCGCTATAAATTTAAATTTGAATGAATTTCAAGTACTGTCAGTGTTATAGTTCGAAAAGATGATGAAACGTGAGGCCCCATGGCGTACGAATGCTGGGACCTCCAAGGTACGTCGCGCTTTAAATTTCTCCCCTCGTAGTGGATTGGGCCCAAAAGCGTCTGCTTGGGTTAATCGGCCCATGTATAGAAAGCCCAGGATTTATCGAACGTATAGATCACCTGATGTTCCAAAGGGCTGTGAAGGCCCTTGTAAGGTACAGTCATTTGAACAGCGTCACGACATTTCTCATGTCGGCAAGGTCATGTGTATATCCGATGTCACACGTGGTAATGGTATCACGCATCGTGTTGGTAAACGTTTTTGTATTAAGTCTGTTTATATCCTAGGTAAAGTATGGATGGACGATAATATTAAACTTAAGAACCACACTAACAGTGTTATGTTCTGGTTAGTTAGGGATAGGAGACCGTATGGTACTCCCATGGATTTTGGACAGGTTTTTAACATGTATGATAACGAGCCGAGTACCGCTACTATCAAGAACGATCTCCGTGATCGTTACCAGGTTTTGCATAGGTTTGCGTCGAAGGTTACTGGTGGACAGTATGCTAGCAACGAACAGTCTCTTGTGAGACGATTCTGGAAGGTGAACAACCATGTGGTGTACAACCATCAAGAAGCTGCTAAGTACGATAATCACACTGAGAATGCATTATTATTGTATATGGCATGTACTCATGCCTCTAATCCTGTGTATGCTACTTTAAAGATACGGATCTATTTCTATGATTCGATATCAAATTAATAAATATTGAATTTTATTATATGATTTTCTTCTTCAACATGTACATATACGAGCGTATCAGCAGCATGTGCAATCGCTCTAATTACATTGTTTATGCCAATGGCACCTAAATCATCTAAGTAACGTCTAATTCGGGAAGAAAATACTTGAAAGAAACTCGAAATCCTCCATCTGGAGGTCGTCCGAACCCTGAAATTCAGGTAGCACTTGTGGAGCTGAAGTGCTTTCCTCAGGTTGTGGTTGAATCTTATCTGCAGCAATAGTAGGTGTCTCGCACCTAGATCTGTGACAGATATTATCTTGAAATAGAGGGGATTTGGAACCCTCCAAGTAAAAACGGAACTCTCTGCCTGATATGCAGTGATGGGATCCCCTGTGCGTAAATCCATCGTCTCTGCAGTGGATGCTCACATATATGGAGCAACCGCATTCCAGGTCAATTCGTCTCCGACGAATTACTTTCTTCGAGTGCCGATGTCGATTCTTGATTTGTGGTATTAAAGAATGGCTCTTCGATGGTGACGTAGATGACGTTTTTTTTGGCCCAGTCATTGATTGCTTTGTTCTTTTCCTCTTCGAAGAACTCCTTATATGATGAAGTAGGCCCAGGATTGCAGAGGAAGATTGTTGGAATCCCTCCATTTATTTGAATTGGTTTGCCGTACTTGCAGTTGGACTGCCAGTCTCTCTGGGCCCCCATAAATTCCTTCATATGCTTTAGATAGTGCGGGTCGACATCATCAATGACGTTGTACCAGGCCTCATTTGAATACACTTTTGGGCTTAGATCAAGATGTCCACAAAGATAATTGTGACGACCCAAACTTCTGGCCCATAATGTTTTCCCTGTCCTAGATGGACCTTCAATGATAATAGATATCGGCCTAAAGGGCCGCGCAGCGGCATCCATTATATTATCGTTAACCCACTGATTAATAACAGCAGGAACGTTATTAAACGATGATAGTGGGAACGGTGGCTCAAAAACATTAACTGGAGGAGCAAAGATCCTCTCCAAATTTTGATTAAGATTATGAAATTGTAATACATAATCCTTTGGAACTAACTCCTTAATGATATTAAGAGCCTCGTCCTTACTTCCGCTGTTAAGCGCCTTTGCATAAGCCTCATTAACTGTCTGTTGACCGCCTCTCGCCGATCTTCCGTCCACCTGGAAAGTGCCCCATTCGCAGAACACTCCATCTTTTTCGATATATGATTTGGCGTCGGAGGAGGAGCGCGCAGTTTCAATGTGACAGTGGAATTGACGTGAGTTCTGTGGATGGGAGAGGTCGAATAATCGACAATTTGTGCAGATGAATTTTTTCTGGAATTGAACCAAGGCATGCAGGTGAGGCGACCCATCTTGATGTTTTTCCTCACAGACTCTAATATAAACGATGTTGGTTGGAAGGGTTAATGCTTGTATTTGGTCTAAGGCTGACTCTTTAGTAACTGGGCATTTTGGCCACGTGAGGAAAAAAGAAACGCCTTGTTTCTTAAAACGACCGCTCATCTTGCGTTTTAAATCGGGGACAATCAAAGTCTCTGATATCCGATATATCGGGGACAATATATAGGTCTCCCAATATTTGTACTAAGAGCGTGCAGAGCCTTTTTATACGGACGCGAAGGGCATTATAGTCATTTCCCTTAGTAATTCAGCGTGTTTTTTGGGTTCCAATCCGCTGCTGCACGCTCCTATTATT
ACCGTGCAGCAGCCGCCGCTTTTTCCGTACACTTTAATTTGAATTGGGCTCCAGTTATTGAAAGCGACGTTTATAAACAAGTGGCCACGATTGCGCCACGTGTTGCAATAATAGCCATGGATAAAAATTATATGTGAGCCACGCGATATTTATCCAAAATTGAAAAAAAAGACCGCGCGTTCATGGATGATAATATTGGATTAACTAATTTTAGAAATGATTTCGTCCAATCATTGATTGACATTGGGGTTTCATTATAACTGAATGGCATCATCCAACTATAAATAACAGAAAATTGTTTAAAAGATAAATTAGCCTGTGATATTTTTTTTTTGTTTGTAAATATGTATATTGGTAAAGGTATACGTTATAGCAACAACACCATGAATCGTGCTAAGTACAACAGACCTGTTGGTCGTCGATCTTTTGTGTATAGGCGCGGTCCTAAAGTACGTGTTAATCAGTCTGTCCCAAAGTCACAGGGTGACAAGATGACCAGACAGCGTATCCATGAAAATCAGTATGGCGTACAGTATTCCCTATTAAACAATACGTCCAGTGTGTCTTTTATCACATATCCTAGATTAGGTGGGCCTGAGCCCAATAGAAGTCGGGCTTACATAAAATTGAATAGGCTTCGTTACAAGGGGACTGTTAATATTGAATGTTCAGATCCAGATGTTGGAATGGATCCCAATCGTGGTGGGCTTTCTGGTGTCTTCACTCTGGCTATTGTTGTTGATAGGAAACCTCATGTTGGACCTACTGGTTCATTGCCATCATTTGACGATCTGTTTGGTTGTAATCTGTACAGCAATGGGAGCCTTGATATCTCACCCCAGATGAAGCAGCGTTACTACATTCGGCACGTACACAAACGTGTCGTATCTTATGAGAAGGATTCTATCATGATGAACATATCGGGCAATATGGGATTATCTTCCCCTAAATATGTATGTTGGTCCTCATTCAAGGACCTTGATGTGGATAGTTGTACTGGGAGCTATTCTAATCTAGCTAAGAATGCTCTTTTAGTTTATTATTGTTGGGTTTCGAACATGCCTTCTAAGGCATCATCATTTGTATCTTTTGACCTGGATTATCTGGGTTAAATTAATAAAAATATATTTGCAATAATAAGAATTGTTTGAAATTGGTAATTGCATTTATAATTCATAATGGTTTAGCCTGTTGAGGCGTACAATTTCTATTAATGCATAAATCGACAGTGCTATTGACAAGTTCTTGTAATTGTGCCCTGCTAAGTGTGATGTTGGACTCGGACCGCGCAGCTGCAACCAGTGATGCCGAGTCACCTGGGTCTAGCATGCTTGTGCTCAGCCTGTGAAGCTCTCTGTATGGGTGTCTGTTATGGGCTACGTCGGACTCTGTCTCGTTAATGTCCACTCCAACTGAGCTCCTTGTGGCCCAAGATTCACCGGGCCTTAGTTCGATTGCCGAATGGAGGGCTGACCTTGATGATGAAGCTGATTTGATCAGCTTCCTCTCGACCTTCCCATATTCCACATGGGAGAAGTCTATATCTTTCCCGGTGAACTGCTTAGATAGTATCTTCACGGTGGGAGAGCGAAAAACGACATCAACGGAGTGCTTGGCTGTGGACATCTTCAGCTTGCCCTTGAACTTGGCGAAATGTGTTCCCTGGTTGACATTAGTGTCTGACACCCTGTAGTACAGCTTCCATGGAATAGGATCCTTGAGTGAGAAGAAGGATGCAGAGAAGTAGTGGAGATCAATGTTGCATCTAATTGGGAAGGTGTATGTCGTCTGTAATGACTCGTTGTCATTCATGCGTGTGTCATGAATCTCGACAATTACTGAGCCAGAAGCGTTAATTGGCACCTGTTGTCTGTACTCGATGACACAATGATCTATCTTCATGCACCTCCTCCTTACAGTTGCACCCCATTGTTCTGCAGTTGATGGGAATTGCAGCACAATCTCTGTGAGATCATGGGTGAGTCTGTACTCGTCTCTATTAGACTCAATATAATTAAAAGAATTGGGAGCGTTAGCTAATTGAGAACTCATGAGGAGATGTTGGTCGCGCAGCGAAACCAGAAAAAATTGTTATGGATGATAAACTAATGACTGAAGAAATGAGACATTATTTGTCTGAGATAATGAAGAGGATAGTCTGTTCATAAGAACATCTGGGTATGGTGTTTGCGTTTTGCGATGGAACTGGTTATATAGACAGATAGATGTACGGATCTAATTGGAGACAACATTCTCTCTCTTTCTCTCTCATCTCTCTCATCTCTCTCTTAATTTCAATTAAATCTTGCTTAATTACGGATAATGATGTTGTTATTATTAAGAGAGATGTTATTAAGAATGATATAATCTCGGACTTTCTATTTTAAATGAAACGACAATCGACTCTGCGTTTTAAATCGGGGACAATCAAAGTCTCTGATATCCGATATATCGGGGACAATATATAGGTCTCCCAATTTATTGGTACGGGAGTCAGCAGCGACATAGACCCTAAACTTCGAGGGCAAGTTGTGTCTTTTCACTATTCAACAAAGGAAAGGACAAATAAAAGTCAGGGGTATTTTGGGTATTTCACTTTATAGTGGCAAAATGGTAAATAACACACCGCTGCTGCACGACCCTATTATT
Gene Information
NCBI Accession
|
YP_001333684.1
|
Location
|
225-968 |
Gene Name
|
AV1 |
Protein Name
|
CP protein |
Coding Region
|
ATGAAACGTGAGGCCCCATGGCGTACGAATGCTGGGACCTCCAAGGTACGTCGCGCTTTAAATTTCTCCCCTCGTAGTGGATTGGGCCCAAAAGCGTCTGCTTGGGTTAATCGGCCCATGTATAGAAAGCCCAGGATTTATCGAACGTATAGATCACCTGATGTTCCAAAGGGCTGTGAAGGCCCTTGTAAGGTACAGTCATTTGAACAGCGTCACGACATTTCTCATGTCGGCAAGGTCATGTGTATATCCGATGTCACACGTGGTAATGGTATCACGCATCGTGTTGGTAAACGTTTTTGTATTAAGTCTGTTTATATCCTAGGTAAAGTATGGATGGACGATAATATTAAACTTAAGAACCACACTAACAGTGTTATGTTCTGGTTAGTTAGGGATAGGAGACCGTATGGTACTCCCATGGATTTTGGACAGGTTTTTAACATGTATGATAACGAGCCGAGTACCGCTACTATCAAGAACGATCTCCGTGATCGTTACCAGGTTTTGCATAGGTTTGCGTCGAAGGTTACTGGTGGACAGTATGCTAGCAACGAACAGTCTCTTGTGAGACGATTCTGGAAGGTGAACAACCATGTGGTGTACAACCATCAAGAAGCTGCTAAGTACGATAATCACACTGAGAATGCATTATTATTGTATATGGCATGTACTCATGCCTCTAATCCTGTGTATGCTACTTTAAAGATACGGATCTATTTCTATGATTCGATATCAAATTAA |
Protein Sequence
|
MKREAPWRTNAGTSKVRRALNFSPRSGLGPKASAWVNRPMYRKPRIYRTYRSPDVPKGCEGPCKVQSFEQRHDISHVGKVMCISDVTRGNGITHRVGKRFCIKSVYILGKVWMDDNIKLKNHTNSVMFWLVRDRRPYGTPMDFGQVFNMYDNEPSTATIKNDLRDRYQVLHRFASKVTGGQYASNEQSLVRRFWKVNNHVVYNHQEAAKYDNHTENALLLYMACTHASNPVYATLKIRIYFYDSISN |
NCBI Accession
|
YP_001333685.1
|
Location
|
965-1357 |
Gene Name
|
AC3 |
Protein Name
|
REn protein |
Coding Region
|
ATGGATTTACGCACAGGGGATCCCATCACTGCATATCAGGCAGAGAGTTCCGTTTTTACTTGGAGGGTTCCAAATCCCCTCTATTTCAAGATAATATCTGTCACAGATCTAGGTGCGAGACACCTACTATTGCTGCAGATAAGATTCAACCACAACCTGAGGAAAGCACTTCAGCTCCACAAGTGCTACCTGAATTTCAGGGTTCGGACGACCTCCAGATGGAGGATTTCGAGTTTCTTTCAAGTATTTTCTTCCCGAATTAGACGTTACTTAGATGATTTAGGTGCCATTGGCATAAACAATGTAATTAGAGCGATTGCACATGCTGCTGATACGCTCGTATATGTACATGTTGAAGAAGAAAATCATATAATAAAATTCAATATTTATTAA |
Protein Sequence
|
MDLRTGDPITAYQAESSVFTWRVPNPLYFKIISVTDLGARHLLLLQIRFNHNLRKALQLHKCYLNFRVRTTSRWRISSFFQVFSSRIRRYLDDLGAIGINNVIRAIAHAADTLVYVHVEEENHIIKFNIY |
NCBI Accession
|
YP_001333686.1
|
Location
|
1095-1610 |
Gene Name
|
AC2 |
Protein Name
|
TrAP protein |
Coding Region
|
ATGGAGGGATTCCAACAATCTTCCTCTGCAATCCTGGGCCTACTTCATCATATAAGGAGTTCTTCGAAGAGGAAAAGAACAAAGCAATCAATGACTGGGCCAAAAAAAACGTCATCTACGTCACCATCGAAGAGCCATTCTTTAATACCACAAATCAAGAATCGACATCGGCACTCGAAGAAAGTAATTCGTCGGAGACGAATTGACCTGGAATGCGGTTGCTCCATATATGTGAGCATCCACTGCAGAGACGATGGATTTACGCACAGGGGATCCCATCACTGCATATCAGGCAGAGAGTTCCGTTTTTACTTGGAGGGTTCCAAATCCCCTCTATTTCAAGATAATATCTGTCACAGATCTAGGTGCGAGACACCTACTATTGCTGCAGATAAGATTCAACCACAACCTGAGGAAAGCACTTCAGCTCCACAAGTGCTACCTGAATTTCAGGGTTCGGACGACCTCCAGATGGAGGATTTCGAGTTTCTTTCAAGTATTTTCTTCCCGAATTAG |
Protein Sequence
|
MEGFQQSSSAILGLLHHIRSSSKRKRTKQSMTGPKKTSSTSPSKSHSLIPQIKNRHRHSKKVIRRRRIDLECGCSIYVSIHCRDDGFTHRGSHHCISGREFRFYLEGSKSPLFQDNICHRSRCETPTIAADKIQPQPEESTSAPQVLPEFQGSDDLQMEDFEFLSSIFFPN |
NCBI Accession
|
YP_001333687.1
|
Location
|
1405-2484 |
Gene Name
|
AC1 |
Protein Name
|
rep protein |
Coding Region
|
ATGAGCGGTCGTTTTAAGAAACAAGGCGTTTCTTTTTTCCTCACGTGGCCAAAATGCCCAGTTACTAAAGAGTCAGCCTTAGACCAAATACAAGCATTAACCCTTCCAACCAACATCGTTTATATTAGAGTCTGTGAGGAAAAACATCAAGATGGGTCGCCTCACCTGCATGCCTTGGTTCAATTCCAGAAAAAATTCATCTGCACAAATTGTCGATTATTCGACCTCTCCCATCCACAGAACTCACGTCAATTCCACTGTCACATTGAAACTGCGCGCTCCTCCTCCGACGCCAAATCATATATCGAAAAAGATGGAGTGTTCTGCGAATGGGGCACTTTCCAGGTGGACGGAAGATCGGCGAGAGGCGGTCAACAGACAGTTAATGAGGCTTATGCAAAGGCGCTTAACAGCGGAAGTAAGGACGAGGCTCTTAATATCATTAAGGAGTTAGTTCCAAAGGATTATGTATTACAATTTCATAATCTTAATCAAAATTTGGAGAGGATCTTTGCTCCTCCAGTTAATGTTTTTGAGCCACCGTTCCCACTATCATCGTTTAATAACGTTCCTGCTGTTATTAATCAGTGGGTTAACGATAATATAATGGATGCCGCTGCGCGGCCCTTTAGGCCGATATCTATTATCATTGAAGGTCCATCTAGGACAGGGAAAACATTATGGGCCAGAAGTTTGGGTCGTCACAATTATCTTTGTGGACATCTTGATCTAAGCCCAAAAGTGTATTCAAATGAGGCCTGGTACAACGTCATTGATGATGTCGACCCGCACTATCTAAAGCATATGAAGGAATTTATGGGGGCCCAGAGAGACTGGCAGTCCAACTGCAAGTACGGCAAACCAATTCAAATAAATGGAGGGATTCCAACAATCTTCCTCTGCAATCCTGGGCCTACTTCATCATATAAGGAGTTCTTCGAAGAGGAAAAGAACAAAGCAATCAATGACTGGGCCAAAAAAAACGTCATCTACGTCACCATCGAAGAGCCATTCTTTAATACCACAAATCAAGAATCGACATCGGCACTCGAAGAAAGTAATTCGTCGGAGACGAATTGA |
Protein Sequence
|
MSGRFKKQGVSFFLTWPKCPVTKESALDQIQALTLPTNIVYIRVCEEKHQDGSPHLHALVQFQKKFICTNCRLFDLSHPQNSRQFHCHIETARSSSDAKSYIEKDGVFCEWGTFQVDGRSARGGQQTVNEAYAKALNSGSKDEALNIIKELVPKDYVLQFHNLNQNLERIFAPPVNVFEPPFPLSSFNNVPAVINQWVNDNIMDAAARPFRPISIIIEGPSRTGKTLWARSLGRHNYLCGHLDLSPKVYSNEAWYNVIDDVDPHYLKHMKEFMGAQRDWQSNCKYGKPIQINGGIPTIFLCNPGPTSSYKEFFEEEKNKAINDWAKKNVIYVTIEEPFFNTTNQESTSALEESNSSETN |
NCBI Accession
|
YP_001333688.1
|
Location
|
2031-2333 |
Gene Name
|
AC4 |
Protein Name
|
AC4 protein |
Coding Region
|
ATGGGTCGCCTCACCTGCATGCCTTGGTTCAATTCCAGAAAAAATTCATCTGCACAAATTGTCGATTATTCGACCTCTCCCATCCACAGAACTCACGTCAATTCCACTGTCACATTGAAACTGCGCGCTCCTCCTCCGACGCCAAATCATATATCGAAAAAGATGGAGTGTTCTGCGAATGGGGCACTTTCCAGGTGGACGGAAGATCGGCGAGAGGCGGTCAACAGACAGTTAATGAGGCTTATGCAAAGGCGCTTAACAGCGGAAGTAAGGACGAGGCTCTTAATATCATTAAGGAGTTAG |
Protein Sequence
|
MGRLTCMPWFNSRKNSSAQIVDYSTSPIHRTHVNSTVTLKLRAPPPTPNHISKKMECSANGALSRWTEDRREAVNRQLMRLMQRRLTAEVRTRLLISLRS |
NCBI Accession
|
YP_001333689.1
|
Location
|
345-1112 |
Gene Name
|
BV1 |
Protein Name
|
NSP protein |
Coding Region
|
ATGTATATTGGTAAAGGTATACGTTATAGCAACAACACCATGAATCGTGCTAAGTACAACAGACCTGTTGGTCGTCGATCTTTTGTGTATAGGCGCGGTCCTAAAGTACGTGTTAATCAGTCTGTCCCAAAGTCACAGGGTGACAAGATGACCAGACAGCGTATCCATGAAAATCAGTATGGCGTACAGTATTCCCTATTAAACAATACGTCCAGTGTGTCTTTTATCACATATCCTAGATTAGGTGGGCCTGAGCCCAATAGAAGTCGGGCTTACATAAAATTGAATAGGCTTCGTTACAAGGGGACTGTTAATATTGAATGTTCAGATCCAGATGTTGGAATGGATCCCAATCGTGGTGGGCTTTCTGGTGTCTTCACTCTGGCTATTGTTGTTGATAGGAAACCTCATGTTGGACCTACTGGTTCATTGCCATCATTTGACGATCTGTTTGGTTGTAATCTGTACAGCAATGGGAGCCTTGATATCTCACCCCAGATGAAGCAGCGTTACTACATTCGGCACGTACACAAACGTGTCGTATCTTATGAGAAGGATTCTATCATGATGAACATATCGGGCAATATGGGATTATCTTCCCCTAAATATGTATGTTGGTCCTCATTCAAGGACCTTGATGTGGATAGTTGTACTGGGAGCTATTCTAATCTAGCTAAGAATGCTCTTTTAGTTTATTATTGTTGGGTTTCGAACATGCCTTCTAAGGCATCATCATTTGTATCTTTTGACCTGGATTATCTGGGTTAA |
Protein Sequence
|
MYIGKGIRYSNNTMNRAKYNRPVGRRSFVYRRGPKVRVNQSVPKSQGDKMTRQRIHENQYGVQYSLLNNTSSVSFITYPRLGGPEPNRSRAYIKLNRLRYKGTVNIECSDPDVGMDPNRGGLSGVFTLAIVVDRKPHVGPTGSLPSFDDLFGCNLYSNGSLDISPQMKQRYYIRHVHKRVVSYEKDSIMMNISGNMGLSSPKYVCWSSFKDLDVDSCTGSYSNLAKNALLVYYCWVSNMPSKASSFVSFDLDYLG |
NCBI Accession
|
YP_001333690.1
|
Location
|
1174-2052 |
Gene Name
|
BC1 |
Protein Name
|
MP protein |
Coding Region
|
ATGAGTTCTCAATTAGCTAACGCTCCCAATTCTTTTAATTATATTGAGTCTAATAGAGACGAGTACAGACTCACCCATGATCTCACAGAGATTGTGCTGCAATTCCCATCAACTGCAGAACAATGGGGTGCAACTGTAAGGAGGAGGTGCATGAAGATAGATCATTGTGTCATCGAGTACAGACAACAGGTGCCAATTAACGCTTCTGGCTCAGTAATTGTCGAGATTCATGACACACGCATGAATGACAACGAGTCATTACAGACGACATACACCTTCCCAATTAGATGCAACATTGATCTCCACTACTTCTCTGCATCCTTCTTCTCACTCAAGGATCCTATTCCATGGAAGCTGTACTACAGGGTGTCAGACACTAATGTCAACCAGGGAACACATTTCGCCAAGTTCAAGGGCAAGCTGAAGATGTCCACAGCCAAGCACTCCGTTGATGTCGTTTTTCGCTCTCCCACCGTGAAGATACTATCTAAGCAGTTCACCGGGAAAGATATAGACTTCTCCCATGTGGAATATGGGAAGGTCGAGAGGAAGCTGATCAAATCAGCTTCATCATCAAGGTCAGCCCTCCATTCGGCAATCGAACTAAGGCCCGGTGAATCTTGGGCCACAAGGAGCTCAGTTGGAGTGGACATTAACGAGACAGAGTCCGACGTAGCCCATAACAGACACCCATACAGAGAGCTTCACAGGCTGAGCACAAGCATGCTAGACCCAGGTGACTCGGCATCACTGGTTGCAGCTGCGCGGTCCGAGTCCAACATCACACTTAGCAGGGCACAATTACAAGAACTTGTCAATAGCACTGTCGATTTATGCATTAATAGAAATTGTACGCCTCAACAGGCTAAACCATTATGA |
Protein Sequence
|
MSSQLANAPNSFNYIESNRDEYRLTHDLTEIVLQFPSTAEQWGATVRRRCMKIDHCVIEYRQQVPINASGSVIVEIHDTRMNDNESLQTTYTFPIRCNIDLHYFSASFFSLKDPIPWKLYYRVSDTNVNQGTHFAKFKGKLKMSTAKHSVDVVFRSPTVKILSKQFTGKDIDFSHVEYGKVERKLIKSASSSRSALHSAIELRPGESWATRSSVGVDINETESDVAHNRHPYRELHRLSTSMLDPGDSASLVAAARSESNITLSRAQLQELVNSTVDLCINRNCTPQQAKPL |