日付;2023/01/19 (木)
先日にシングルセルRNAシークエンス(scRNA-seq)のライブラリ作成を行った。自分にとってのこの作業はこの研究所に来てから2回目であるが、なんとなく慣れてきた状態である。これは習得という意味では良いかもしれないが、中ダルミという意味ではなにかをやらかしそうな雰囲気がして怖くて仕方ない。ここでは、現時点におけるscRNA-seqのライブラリ調整の辛さを、個人的な視点でダラダラと書こうと思う。
価格
このscRNA-seqのライブラリ作成(調整)の全行程を一人で行う場合、かなりの精神的な辛さを経験する。もちろん、肉体的な疲れも当然感じるが、はっきり言って、今回行った生細胞を使ったscRNA-seqライブラリ(10xGenomicsの3′ Gene Expression kit; 3’GEX kit)の作成は実際上はそんなに顕著なものではないと思う。日常で腫瘍や組織サンプルのシングルセル化を行っている場合、おそらくはすでにその作業に慣れている可能性が高く、作業全体でも大したことは行わない。しかし、問題なのはその1キット分の価格である。もはや日本のアカデミックの研究室の大部分、本当に9割の研究室では到底出資できる額ではない。現時点で1キット4サンプル分で130万円位する。それに、今回はFeature Barcode Technologyという、Total-seq antibodyを使ったCITE-seqということをやろうとしているので、その基本となる約130万円に、1本8万円くらいするラベル用の抗体の数と、そのFeature Barcodingに対応するキットが合計25万くらいが加算され、合計で150万円を超えそうな金額になる。もしこれが組織のシングルセル作成(これをサンプル調整という)とその後のライブラリ調整を一人で行う場合「失敗したら150万円、そして4ヶ月以上の準備期間が飛ぶ。絶対に失敗できない。」という異常なまでの精神的圧力に襲われてしまうってわけである。
この実験では、大きく分けて作業が3つある。まずひとつ目は、組織を採取してシングルセル化するサンプル調整、次に10xGenomicsのChromium Controllerを使ったエマルジョン作成、3つ目はライブラリ調整である。どの作業にもトラウマを植え付けるに十分な難しさがある。
サンプル調整
組織を採取して、その組織をコラゲナーゼやヒアルロニダーゼを使って細胞を分離させ、それを抗体で標識し、ソーター(FACS)やマグネットビーズで目的の細胞を回収する作業である。ここでは出来る限り手早く作業を進め、死細胞を出来る限り除き、多くの生細胞を得る努力をしなくてはならない。このあたりは10xGenomicsのプロトコール集に載っている方法と材料を使えば、上手に出来るのではないかと思う。個人的に、それらの効率に大きく影響を及ぼすものとして、ミルテニーのDebris removal solutionとMACS dissociaterだろうと思う。アメリカでポスドクをやっていた頃は、この手のシングルセル化は、Ficollや通常のシェーカーなんかを使っていたが、それだと死細胞がかなり多い”汚い”サンプルが出来上がってしまっていた。それが、今の所属研究室に来てから、とは言っても多少無理やり感は否めないのだが、随分と良いコンディションのサンプルを調整出来るようになった。これは上述のDebris Removal solutionとMACS dissociaterのお陰だろうと思っている。
次に生細胞だけをエンリッチするためにミルテニーのDead Cell Removal solutionとMACSの分離用のカラムとマグネットを使ったり、抗体で任意の細胞を標識し、それのみを回収するソーティングを行ったりするのだが、ここはサンプル調整で最も辛いところかもしれない。まず、生細胞のエンリッチメントをカラムを使って行う場合は、たまにうまく行かないことがある。少なくとも、数回の予備実験で確実に上手くいく条件を求めて置く必要がある。ここでもやはりミルテニーのDead cell removal kitとMACSマグネットが一番良いと思う。余談だが、BiolegendのMojo sortを使ったことがあるが、それはデータシートに従って細胞数が増えた分だけ使用する試薬をスケールアップすると、今度は非特異的な染色が増えまくって全くセレクションされないということを経験した。慣れてくると、かなりの数の細胞を集めることが出来るようになるのだが、それは所見ゴロシってヤツだと思う。BiolegendのMojo sort関連の抗体は、最も非特異的染色が少ない抗体の量を見極める必要があった。特に、一次抗体を認識するマグネットビーズなんて、細胞数がデータシートの記載よりも一桁多かったとしても、データシートにある最低量をいつも使用するのがベストだったし、マグネットを通す前の洗浄は、データシートに記載の回数よりも3回位増やしたほうが綺麗なサンプルが得られた。ミルテニーのBeadsは、こういうことは少ないように思う。まぁ、主観だが。あと次のコツとしては、このscRNA-seqの実験には、MSカラムがちょうど良いということだ。LSカラムは大きすぎた。実際に起ったことは、カラムの洗浄に使用するバッファーが大量であること、その割に細胞が少なく、むしろロスが多すぎるということだ。次の工程のエマルジョン作成に用いることができる細胞数は、Chromium Controllerでは16500個だけなので、そんなに細胞が必要ないというこも関係している。
今回はCITE-seqということで、とある細胞を抗体で標識し、次にFACS Aria IIでソーティングを行っており、死細胞の除去にミルテニーのDead Cell Removal solutionと分離用のMACSのマグネットは使用しなかった。なので、そういった不安はない。ただし、ソーティングは半端な遅さでなないので、その間に死細胞が増えてしまうことは避けることができない。
マグネットでもFACSを使う場合でもそうだが、最終的に得られる細胞が激減する。それに、血球計算盤とトリパンブルーを用いた細胞計測で、もし死細胞が50%もあったら、その時点で精神的だけでなく、肉体的なダメージが甚大なものになる。10xGenomicsによれば、そのようなセレクション後に死細胞が多すぎる(Viabilityが70%を下回るとか)場合は、もう一度カラムに通すなどの処理が必要になるようだ。FACSでの失敗はもはや致命的だろう。そんな時間のかかるソーティングをもう一回やるのは、本当に精神が崩壊しかねないし、実際に2回やったとして十分な細胞が残っている保証さえない。それに加えて、回収できる細胞が1ミリリットル当たり100,0000個もいれば100点な気がする。それにFACSを用いた場合、マグネットに比べてトリパンブルーでカウントした”実際の”死細胞が多くなってしまい、ただでさえ難しいカウントに拍車をかける。これ、本当に辛い。本当に事前の予備実験が重要だと思う。それに何が辛いって、朝8時くらいからマウスの解剖を初めて、この作業を終えるので夕方の4時を回る。この後に、心理的トラウマ最難関のエマルジョン作成と、まるで仏のようなメンタルが必要なライブラリ調整が待つことを考えると、地獄でしかない。
エマルジョン作成
scRNA-seqのライブラリ調整における次の難所はChromium Controllerを使ったエマルジョン作成である。この作業は明らかにメンタルを折りに来ている。作業自体はそんなに大変ではない。時間としても、早ければ30分くらいで終わってしまうし、長くても45分もあれば十分に終わる。なにが辛いかといえば、なんと運の要素も入ってくることである。どれだけの集中力を持って細心の注意を払い準備をしたところで、うまくエマルジョンができないこともあるようだ。作業自体はすごく簡単なのに。その場合、言うても自分は未だ失敗を体験していないのだが、キットが消費期限内であることや、その他の方法が10xGenomicsで保証するプロトコールに従っている場合(ここではもしかしたら血球計算盤を用いた細胞カウントのときの顕微鏡写真が必要になる可能性もあるので、不安ならばそれを撮影する必要がある。)、エマルジョンの写真を撮って10xGenomicsに送れば新しくキットを送ってもらえるらしい。こういったことを事前の講習でいっぱい聞くので、心理的な負荷は更に強まってしまっている。これが無事成功すれば一安心感はある。しかし、そうも言っていられない。次はライブラリ調整という精製地獄である。
ライブラリ調整
無事にエマルジョン作成を終えると、休む暇もなくcDNAの合成とその後の精製が始まる。ここは、単に集中力が必要な作業である。多少は運もあるだろうが、もはや自分で容量を計算したりする必要もなく、インストラクションに沿って試薬を入れていき、適切にPCRを行っていくだけである。しかし、DynabeadsとSPRIselectを用いた精製が幾度も出現する。Dynabeadsは最初だけだが、気が狂うほどSPRIselectを使う。それに、最後のトドメは、調整したcDNAライブラリをアジレントのバイオアナライザーで解析する部分である。こも地味に40分くらいは必要だし、もしライブラリ調整がうまく言っていなかったらと思うと、正気を保てなくなりそうだ。ここまで順調に作業を進めても、一人でここまでやる場合は夜10時くらいになる。もし何かトラブルがあるなら、確実に次の日になるだろう。
地獄は終わらない
無事にライブラリ調整が終わったら、一時の休息って感じがする。しかし、現所属のように実験系を立ち上げたばかりのラボでは、次のシークエンスでも一苦労である。シークエンスは基本的に外注になるが、残念ながら、日本では未だscRNA-seqがメジャーではない。少なくとも、シークエンサーを実際に使うWetの技術員は、scRNA-seqの目的、方法、こちらの意図なんて理解していない。それにシークエンスを生業としている一般企業の人間で、scRNA-seqとbulk RNA-seqの技術的な違いを明言できる者はいないのでは無いかと思えるくらいだ。これは本当に日本という国の基礎力の無さを象徴することだと思う。特に、ウチのようにシークエンスのイチゲンさんになってくると、その企業からも軽く扱われるのでは無いかと思うこともある。以下に記すが、昨年(2022年)実際に信じ難いことが起こった。
昨年(2022年)に筑波大学初のベンチャーかなんか知らないが、某大学の先生に紹介してもらってiLacという会社に作成したライブラリのシークエンスを頼んだことがある。スカイプによるミーティングで、「これらはscRNA-seqの解析であり解析には後にcell rangerを使って解析すること」「10xGenomicsの3’GEX kitを使ったライブラリであること」「デュアルインデックスであること」「チューブごとのサンプルインデックスのDNA配列」を伝えている。これまで言えば、もう返してくるfastqファイルは4つ(I1、I2、R1、R2)である。某大学の先生も、その4つ以外は帰ってきたことが無いと言っていた。それなのに、さらには、ミーティングで上記の情報を伝えているにも関わらず、なんとbulk RNA-seqのような、通常のfastqが帰ってきた。それに勝手にXPモードで読んで返してきた。某東大学の先生の情報が正しければ、そのiLACという会社は顧客を選んでいる可能性だってあるし、少なくとも担当したI氏は、全くこちらの話を理解していなかったことになる。幸い、シークエンス自体は上手く言っていたので、後日cell ranger mkfastqかイルミナのbcl2fastqを使って正しいfastqを作成するように言ったが、それでも全くファイルを作成することが出来なかった。これが2回も続いた。マジなのか。iLACに元R研先任研究員って書いてあるんだが、どういうことなんだろうか。これはビジネス・イキリ・マウンティング肩書だろうか。というか、きっとそうだろう。結局その時はシークエンスの後に保存されるBCLファイルをもらって自分でcell ranger mkfastqで正しいfastqファイルを作成した。こんなこと、シークエンスを生業としている業者ではやらないのではないだろうか。
scRNA-seqでは、細胞あたり20000リードは必要と言われている。そして、推定で最大10000個の細胞からライブラリを作成しているので、合計でサンプルあたり合計2億リードが必要である。この数字はNovaseq 6000とかでないと達成することが難しく、それに応じて値段も90から100万円くらい必要である。そんな額を支払うことから、このような修士卒の学生のようなプロにあるまじき仕事をする業者は全く受け入れ難い。個人的には、某東大学の先生がそこを使っていようとも、iLACの、特にI氏の担当は絶対に避けたいところである。速さも大事だが、それで合計300万円を投げ捨てるのは絶対に駄目である。
それに加えて、今回はFeature Barcodeのライブラリもある。それをいくつかの会社とミーティングをして、ついでに見積もりをとって、どの会社が一番良いか選ぼうと思う。この一件の後、10xGenomicsに10xGenomicsから認定を得たシークエンスの業者を3社(KOTAI、かずさ、アゼンタ)教えて頂いたので、まずはその3社に打診して見ようと思う。その他にも、ノボジーンのなんとかというマーケティングマネージャーが研究所に回ってきたときに、少しこちらの要望と相手のやっていることを話たことがあったが、そいつも話を30%も理解していないように見えた。こっちの頭がどうかしているのだろうか。いや、だとしたらいつそういう話をするのだろうか。いい加減にしてほしい。ただし、どうもiLACよりまノボジーンのほうが良さそうだったが。
ライブラリ調整を無事に終えたとしても、こちらの要望をちゃんと理解してくれて、かつウデが良いシークエンスの業者を選ぶ、という地獄….こちらの説明が悪い可能性ももちろんある。だから今回は、学会発表くらいちゃんとスライドを作って、業者とのミーティングに臨むつもりである。