日付;2025/03/16(日)
Uniprotを使った簡単なMSA(Multiple Sequence Alighment)
仕事で現在行っているプロジェクトが一段落しそうな雰囲気が出来てきた。この仕事をやりきった上で今年の7月に夏休みをとろうって感じになっている。そして、そのプロジェクトが一段落する時点で、タンパク質-タンパク質相互作用(Protein-Protein Interaction; PPI)の解析と推定をRとPythonで学習させてもらえることになった。これまでの研究キャリアの中で遺伝子発現の解析や、すこしだけ変異解析なども行ってきたが、PPIの解析を本気で行うことはなかった。正直にいえば、MSA(Mupltiple Sequence Aligment)のアルゴリズムとかもイマイチ理解していない。しかしながら、仕事でこの手の解析も多少なりとも必要になってきているのは事実なわけなので、やっぱり勉強刷る必要がある。なので、その一発目として、Uniprotを使ったMSAに関して、なんか忘れそうなので記録しておく。
アミノ酸配列のダウンロード
最初にUniprot(https://www.uniprot.org/)に行く。そこに、CSNK2A1と入力する。これは、カゼインキナーゼ2というヤツで、進化上のホモロジーもけっこう高いタンパク質である。

そうすると、以下のように検索結果が表示されるので、ここではReviewedのレコードにチェックをいれ、Downloadを押す。

そして、最も汎用的と思われるFASTA(というか、この中でFASTAしか知らん)と、Commpressedにチェックを入れて、ダウンロードする。多くのアミノ酸配列をダウンロードする場合は圧縮した方が良いだろうし、今回のように数が多くない場合は圧縮する必要はない。今回は、Download selected、FormatをFATSA(Canonical & isoform)、CompressedをNoに(以下の画像ではYesになっているが…)チェックを入れて、下にあるDownloadボタンを押した。

もし他のタンパク質や、特殊なモデル動物のアミノ酸配列を別にダウンロードした場合は、それらのFASTAファイルは別々になっているはずである。その場合は、以下のようにcatで結合したらよい。これにより、CSNK2A1.faがカレントディレクトリに出力される。注意点としては、UniprotのMSAはアミノ酸配列が50個しか流せない点であるので、多くのアライメントやそれらの進化系統樹を出したい場合は他のライブラリを使用する必要があるだろう。ちなみに.fastaと.faのどっちでもFASTAフォーマットの拡張子として使用可能である。faを使っているヒトも多い気がする。faを見ると、自分は何故か身構えてワンテンポ遅れる、一歩遅れて「あ、これfastaか。」ってなる。
cat \
"/mnt/team4tb/Dropbox/Downloads/uniprotkb_accession_P19139_OR_accession_2025_03_16.fasta" \
"/mnt/team4tb/Dropbox/Downloads/uniprotkb_CSNK2A1_DOG_2025_03_16.fasta" \
> CSNK2A1.fa
BashAlign
次に、MSAを行う。一番上のAlignを押すと、以下のページに行くので、load from a text fileと青字で書いてあるところをクリックし、上記でダウンロードした、もしくは自分で作成したfastaファイルを選ぶ。最後に、下にあるAlign 8 sequencesを押す。

そうすると、アライメントが始まる。ここで、fastaファイルに同じアミノ酸配列が入っていたりするとエラーになるので注意。例えば、質量分析で得られたシークエンスから、自分でfastaファイルを作ったりすると、ミスって重複させたりする(実際にやってた。)

アライメントが終わると以下のようにCompletedとなるので、それを押すと表示される。

結果は以下の通り。カゼインキナーゼは進化上のホモロジーが非常に高いので、多くの動物で同じ配列が得られている。ここではClustalで表示してある。リン酸化に関与するタンパク質ならば、Serine Threonine highligtなんかも興味深いと思う。

まとめ
以上がUniprotを使った簡単なMSAである。仕事上、そんなに深入する時間がないけど、ちょっとしたデータがあれば、OK、という場合には非常に有効と思われる。特に「なんか、このタンパク質ってアイソフォームがいくつかあって、アイソフォーム2がノックダウンされてないような気がするのだが…」
とか、そういったレベルの議論をしている研究室や職場には、こうやってイキるのも一つの手ではないだろうか。イキるにはコレで十分である。