macbook pro (13inch, early 2011)でのRNA-seqが遅すぎて限界なのでmouse K5を購入した│基礎医学生物学研究者のブログ

macbook pro (13inch, early 2011)でのRNA-seqが遅すぎて限界なのでmouse K5を購入した

日付;2022/08/20(土)

macbook pro (13inch, early 2011)が限界

以下の画像は、今の職場でちょっとした好奇心で行っているRNA-seqの解析の一部であるSTARによるリファレンスシークエンスへのマッピングの結果である。

STARの結果。ちゃんとマッピングはできているようだが、費やしている時間が半端ではない。

今年はまだ現職について3か月くらいしか経っていないので、科研費申請を行えるだけの基礎データが、はっきり言って皆無である。それに、その職場がコロナウイルス対策として”私語禁止”に限りなく近い状態を作ってしまっているため、所属研究室を含めた多くのデスク周りでの結果などのディスカッションがない。また、施設全体で、大学の研究室では一般的と思われるラボミーティングさえも、当然ながら論文抄読会なども一切ない。こんな状態で科研費のアイデアなんかはどうやったって生まれない。今度別のポストで愚痴ろうと思うが、こういう状態なのでブレークスルーがないのだろうと思う。とにかく、この”私語禁止”状態をなんとかして解除してほしい。どう考えても研究の効率が悪い。良いとども思っているのだろうか。そうだとしたら即刻「研究所」としての看板を下ろしてほしい。存在するだけで迷惑である。詐欺である。別件ではあるが、この職場はこのようなコンピューター解析に対しても非常に疎い。なので、この程度のRNA-seqをもらうのも滅茶苦茶苦労した。まぁ、今後のためにdisるのはこのくらいで止めておこうと思う。無限にdisれる。こういう状態が事前にわかっていたらこの職場にはまず間違いなく来なかった。これがオンラインのみの就職活動の怖いところである。若干予想はしていたが、それ以上に酷すぎた。キリの良いところで次のキャリアに行こうと思う。

そういうことで、上述のように科研費のネタにもなるだろうかと始めたRNA-seqの一部、STARによるアライメントの出力である。ちなみに、今回はSTARによる2 pass mappingもやって融合遺伝子の解析もやってみようとおもっていたのだが、そんなことをやってしまったら本当に2週間以上ことになっていたので、しょうがなく最も一般的なコマンドで解析することにした。それでも全ファイルを処理するのになんと5日も費やしてしまっている。

とうとう恐れていることが現実のものになってしまった感じがする。もはや、仕事にならない。時間があるときにこの解析に集中していたらしっかりした解析ができていただろうし、科研費だって少しは書きやすくなったかもしれない。こんなことをしているうちに少しずつ実験が増えていき、今週はとうとう論文を漁る時間さえなくなってしまった。時間は戻ってこない。休日は仕事なんかしたくないが、やれるときにやれないのは全く良い気分ではない。

mouse K5

ということで、金もないのにmouse K5を購入することを決めた。実は、あまりにも上述の解析に時間がかかりすぎていたので、いやいやながら職場のPCでWindows Subsystem for Linux(WSL)というヤツを使ってみたのが事の発端であった。思った以上に快適である。というか、もはやLinuxそのものである。デスクトップ版のLinuxと遜色が全くもって無い。WSLスゲエと思う。それに、職場のMouse K5は、少なくともRでbayseqの使用や多くのサンプル間をフィッシャーの正確確率検定で解析することが念頭にあったために、メモリを32GBも積んだ。「64GBは値段も少し上がるし、そんなにいらないだろうし」的な遠慮もあり、64GBは積んでいなかったが、それにしたってこんなに早いとは思わなかった。Windows 11はLinuxを使うものにとってかなり快適ってことである。もはやMacがなんとかという自社で開発したCPUを載せていて、もはやゲノム解析用に代々コンパイルされてきたバイナリーファイルが使えないとかを考えると、もはやMacなんかに買う気にも使う気にもなれない。結局、世の中Windowsである。Microsoftさん、またストゥーピッドなOSは出さないでください。

デザインはシンプルだが、必要以上にうるさい箱。

また、こんどsingle cell RNA-seq(scRNA-seq)解析用にUbuntu入りのコンピューターが納品されてくる。これのテストランに使用するコンピューターも欲しいと思っていた。はっきり言ってUbuntuはあまり好きではない。まずこれまで使ってきたDebianで問題にぶつかったことがない。それに、UbuntuはDebianの開発版を使って組まれているところもあまり好きではないし、半年毎にUpgradeとか、不安定すぎる。そもそも、ダサい。なんですか「ウブンツ」って響きは。口に出して発音したことありますか??それに現状こんなので平和なんかにならねぇわ。そんなこんなで、Ubuntuを使いこなせるように勉強する必要がある。

64GB必要な理由もちゃんとある。解析ではcell rangerという10xのソフトウェアが必要だが、どうやらこのソフトのインストール時にPCの性能がチェックされる。10xがAWSを使って行ったベンチマークでは、64GBでようやく解析ができるような結果が載っていた。ただし、このベンチマークでは、現実的な時間で解析を終えようと思うと、128GBのメモリと12treadsのCPUが必要だったと思う。これが一つ目の理由である。また、2つ目の理由としてはfusionCatcherである。以下の画像の通り、インストールにメモリが24GB必要らしい。それに加えて、よくマニュアルを読んでいると、ストレージの空き容量が700GB必要らしい。一時ファイル置き場に使われるようだ。以前Dell M4800を使っていたときはそもそも32GB、ストレージは合計で2TB、外付けHDDで5TB積んでいたので、そんなこと気にもしていなかった。しかし、macbook pro 13 inch early 2011は16GB、1TBしか積んでいないので、当然これに引っかかる。それにこのfusionCatcherはSTAR 2passを使う。もしライブラリサイズのデカいデータを処理しようとすると、サンプルを一つ処理するのに12時間以上必要だろう。それは、単純にマズい。また、ゲノムの解析も覚えたいということもある。全ゲノムの解析をしようと思ったら、確実に64GBは必要である。STARでさえ、もはや55GBくらい喰っている。

メモリ足りねぇわ。なんか他にもミスってるし。

そういうことで、悩んだ挙句に個人的実績のあるmouse K5を物理メモリ64GB以外は基本構成で購入した。まずこれで今後、WSLを使ってUbuntuを入れ、その上にRNA-seqで利用する基本的なソフトを入れてみようと思う。そして、次に、デスクトップ版のUbuntuを入れて、本格的に解析用として立ち上げてみようと思う。

mouse K5の購入理由

実際の作業について記す前に、金もないのにこのコンピューターを購入した理由と、使い慣れたDebianからUbuntuに乗り換えることにした理由を記しておく。

理由1

今度、職場にシングルセルRNAシークエンス(scRNA-seq)用のコンピューターが届く。それは基本Ubuntuで動かすことになる。また、自分はこれまでDebianを使ってきており、Ubuntuはあまり詳しくない。仕事ではUbuntuがあんまりわからないという理由で解析が遅くなるのは全く良くないことだ。なので、納品までの間、少しでもUbuntuになれなければならない。少なくともこれまでDebianで行ってきたRNA-seqの解析くらいは一通りできるようにならないといけないと思ったためだ。

理由2

理由1とほとんど同じだが、なんだか現職場でRNA-seq関連の話をしているうちに、なんだか専門家っぽい感じになってしまった。完全にエセである。東北生まれの人間が関西で住むようになって関西弁をしゃべるようになり、それが抜けなくなってしまったくらいのエセBioinformaticianである。そんなこんなで、scRNA-seqやその他の解析について、更にモタモタできなくなってしまったためである。いよいよしっかりと勉強しなければならないってわけである。

理由3

個人的な理由であるが、やっぱりこの手のRNA-seqの解析技術を少しでも高めたいという思いがあったためだ。おそらく、ここの職場にはそんなに長く居ることはできないのではないかと思っている。つまり、あと3年もしたら、もしかした来年とかに就職活動しているかもしれない。そこでは、業績はないかもしれないが、何か魅力的なスキルセットを用意しなければならない。それに、こうやって学んだスキルは必ず使う場所があると信じている。それで。

理由4

最近、これまで使用してきたMacbook Pro 13 inch early 2011(MBP13)が、一般的はRNA-seqだったとしてもかなりの時間を要することが露呈してしまったためだ。それに、Dell M4800を使っていたときはほとんど感じなかったメモリやストレージ不足(解析時の一時ファイル置き場)もはっきりしてしまった。fusionCatcherとか、Cell Rangerとか、インストールもできない感じになっていた。さすがに10年以上も前のコンピューターでは限界だったようだ。

mouse K5の欠点

これだけは言っておきたい。このキーボード、すごく打ちにくい。キーボードが小さい。おそらくケチって小さいパソコン用のキーボードを使っているためだろう。テンキーなんかいらないので、キーボードを1.5倍くらいのサイズにしてくれ。MSIのコンピューターみたいに。絶対にそっちほうが良い。

あと、このスゲー黄色がいらない。100%全員が眩しくて鬱陶しいし、ダサいので初起動直後にデスクトップの壁紙を変えるに決まっている。マウスコンピューターの人、もう少し考えろ。ユーザーはお前んところの会社ではなく、コンピューターを必要としている。ロゴはいらない。

箱もそうだったが、デスクトップもうるさい。というか、単に眩しくて使いにくい。

mouse K5の利点

他より安い。以上。これがシンプルにして最大の利点である。ほかにいうことはない。個人的には「OS無し」でできる限り安いオプションも欲しい。