系統樹の書き方(MEGAを使用した系統樹の書き方)

はじめに

今回はヒト/マウス/ニワトリのグロビン遺伝子の系統樹解析をやってみます。

以下の順番で進めます。


①. MEGAのインストール

↓

②. アミノ酸配列の準備

↓

③. MEGAにアミノ酸配列を取り込み、マルチプルアライメント

↓

④. 系統樹の作成


①. MEGAのインストール

MEGAX1からMEGAをインストールしてください。

公式ページにはMEGA7とMEGAXがありますが、今回はMEGAXを使用しています。

系統樹の書き方(MEGAXのインストール)


②. fastaの準備

今回は以下の10遺伝子を使用します。

ミオグロビンとα/βグロビンで遺伝子重複が起こり、その後分岐したというストーリーを想定しています。

id日本語での説明Ref
dre:100000711ゼブラフィッシュ ニューログロビン(外群)Ref
gga:418056ニワトリ ミオグロビンRef
mmu:17189マウス ミオグロビンRef
hsa:4151ヒト ミオグロビンRef
gga:416652ニワトリ αグロビンRef
mmu:15122マウス αグロビンRef
hsa:3039ヒト αグロビンRef
gga:396485ニワトリ βグロビンRef]
mmu:15129マウス βグロビンRef
hsa:3043ヒト βグロビンRef]
>dre:100000711
MEKLSEKDKGLIRDSWESLGKNKVPHGIVLFTRLFELDPALLTLFSYSTNCGDAPECLSS
PEFLEHVTKVMLVIDAAVSHLDDLHTLEDFLLNLGRKHQAVGVNTQSFALVGESLLYMLQ
SSLGPAYTTSLRQAWLTMYSIVVSAMTRGWAKNGEHKSN
>gga:418056
MGLSDQEWQQVLTIWGKVEADIAGHGHEVLMRLFHDHPETLDRFDKFKGLKTPDQMKGSE
DLKKHGATVLTQLGKILKQKGNHESELKPLAQTHATKHKIPVKYLEFISEVIIKVIAEKH
AADFGADSQAAMKKALELFRNDMASKYKEFGFQG
>mmu:17189
MGLSDGEWQLVLNVWGKVEADLAGHGQEVLIGLFKTHPETLDKFDKFKNLKSEEDMKGSE
DLKKHGCTVLTALGTILKKKGQHAAEIQPLAQSHATKHKIPVKYLEFISEIIIEVLKKRH
SGDFGADAQGAMSKALELFRNDIAAKYKELGFQG
>hsa:4151
MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASE
DLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKH
PGDFGADAQGAMNKALELFRKDMASNYKELGFQG
>gga:416652
MVLSAADKNNVKGIFTKIAGHAEEYGAETLERMFTTYPPTKTYFPHFDLSHGSAQIKGHG
KKVVAALIEAANHIDDIAGTLSKLSDLHAHKLRVDPVNFKLLGQCFLVVVAIHHPAALTP
EVHASLDKFLCAVGTVLTAKYR
>mmu:15122
MVLSGEDKSNIKAAWGKIGGHGAEYGAEALERMFASFPTTKTYFPHFDVSHGSAQVKGHG
KKVADALANAAGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLASHHPADFTP
AVHASLDKFLASVSTVLTSKYR
>hsa:3039
MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHG
KKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTP
AVHASLDKFLASVSTVLTSKYR
>gga:396485
MVHWTAEEKQLITGLWGKVNVAECGAEALARLLIVYPWTQRFFASFGNLSSPTAILGNPM
VRAHGKKVLTSFGDAVKNLDNIKNTFSQLSELHCDKLHVDPENFRLLGDILIIVLAAHFS
KDFTPECQAAWQKLVRVVAHALARKYH
>mmu:15129
MVHLTDAEKAAVSCLWGKVNSDEVGGEALGRLLVVYPWTQRYFDSFGDLSSASAIMGNAK
VKAHGKKVITAFNDGLNHLDSLKGTFASLSELHCDKLHVDPENFRLLGNMIVIVLGHHLG
KDFTPAAQAAFQKVVAGVATALAHKYH
>hsa:3043
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPK
VKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFG
KEFTPPVQAAYQKVVAGVANALAHKYH

③. MEGAにアミノ酸配列を取り込み、マルチプルアライメント


# ③-1. ファイルを取り込む

Align → Edit/Build Alignment → Retrive sequences from a file でアミノ酸配列のファイルを取り込みます。

系統樹の書き方(MEGAXにfastaファイルを取り込む)


# ③-2. マルチプルアライメント

上メニューバーの筋肉マークを押して、マルチプルアライメントをします。

MEGAの中に内蔵されているMUSCLE2というツールを用いてアライメントしています。

系統樹の書き方(MEGAXでマルチプルアライメント)


④. 系統樹の作成

上記の画面で「Data」 → 「Phylogenetic Analysis」とすることで、系統樹作成の準備をします。

ホームの画面に戻って、「Phylogeny」 → 「Construct/Test xxx Tree…」 とすることで、系統樹を生成します。

系統樹の書き方(MEGAXで系統樹の作成)

MEGAでは系統樹生成に用いる複数のアルゴリズムを使い分けることができますが、ここでは簡単な方法であるNeighbor-Joining法を使用しています。

アルゴリズムの違いについては、系統樹のアルゴリズムなどもご参照ください。


結果

以下のような画面が出力されていれば成功です。

系統樹の書き方(MEGAXで系統樹の作成) 結果


引用文献

  1. Kumar, S., Stecher, G., Li, M., Knyaz, C. & Tamura, K. MEGA X: Molecular Evolutionary Genetics Analysis across Computing Platforms. Mol. Biol. Evol. 35, 1547–1549 (2018). 

  2. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32, 1792–1797 (2004).