医学生物学者のエセ統計解析について

日付;2021/02/28(日)

今日もマウスのへの薬剤の投与である。昨日街があまり混んでなかったので今日はタイムズスクエアに行こうと思っていたが、天気がけっこう悪いのでやめてすんなり家に帰ろうと思う。と思ったけど、いつものクセで51st駅まで来てしまったので、ついでにフォレストヒルズのサクラ屋に言ってビール買って帰ろう。

フォレストヒルズ。ロックダウン直後もサイドウォーク席が大盛況だった。もうインドアダイニングも始まってきているし、この光景もいつまで見れるのやら。

昨日も書いたが、自分が所属するラボは投与する薬剤を対象となるマウスにランダムに割り当てて投与を開始している。このランダマイゼーションはなんとかしてほしい。 Phase IやPhase IIを見据えた実験には必要だろうが、基礎実験においてはPilot studyに対してこんな厳密でややこしいプロセスは必要ないと思う。かえってテクニカルエラーや時間的なコストだって増えるし、ラボによってはこういったスキルを維持するための人材や指導など(たとえば、無料で統計的な解析などをやってくれる部署があれば良いが、これを同僚などに頼っている場合はどうやって維持していけばよういのだろうか、という意味。ポスドクやRAなどの研究者にまかせている場合、その一貫性は彼ら・彼女らの能力に依存することになる。ボスの知識が浅かったりすると、この問題が顕在化してくると思う。やるのはいいが、例えば、Rのスクリプトを残すのは良いが、それを残したとして、だれが責任を持つのだろうか。ボスだろうか、それのスクリプトを使っていた人だろうか。現状ではこれが不安。ハイインパクトな研究では、そういったポリシーが重要なのだろうと思う。)も必要になる。

そのくせ、in vitro感覚が抜けていないのも困る。まるでエセ・トランスレーショナル・スタディだ。自分には特に臨床試験には参加ていないように見えるし、かといって本格的に臨床応用を目指しているとも思えない。本当に臨床研究や臨床応用を目指しているならば、これまで採取した患者由来組織を使って研究してもいいはずだ。なぜ使わない?それに、そういった人なのにランダマイゼーションや統計の知識がほとんどない(ように見える)のはなぜだ?ここに来たときやっていた統計解析方法を聞いてゾッとした事がある。in vitroの解析だったのだが、「どっちを使っていよいかわからないから、Paired T testとStudent’s T testを両方やって、有意差を確認している。」とか言っていた。「は?マジがコイツら。そんなことには付き合いたくないぞ。」と思った事がある。それに、生物学者がよくやる、Student’s T testを多群の比較に適応するのも、もちろんもれなくやっていた。そりゃちゃんとした有意差なんか出ないし、出たところで正しくない。だから論文のリバイス時に、あるタンパク質の阻害とアポトーシス誘発率の整合性が合わなくなって、こじつけのような計算をして有意差を出していた。「この計算は正しいか?」と聞かれた事があるが、自分は正直ひいてしまったが「普通はやらない。それが必要なら論文にちゃんと述べろ。」と回答したことがある。あれは本当にパブリッシュしたのだろうか。自分はオーサーに入っていなかったので、よく知らない。ランダマイゼーションにしたって、自分が見る限り過去に在籍したラボメンバーはだれも正しくできてなかったように見える。特に、なんというサイトか忘れたが、そして何処で見つけて来たのか、おかしなサイトを使って治療群を割り当てていた。こういったものよく信じたものだ。使うのはいいが、論文にその旨、使ったサイトのURL、バージョンくらい書いてほしい。Supplementでも何でもいいから、書くべきだと思う。たった一行だし。ついでに書くと、日本で在籍したラボで、「最大値と最小値を除いて、平均値を出す。」と言っていたボスもいた。それは駄目だろ。エラーを故意に小さくしていることにならないか??最大(最小)値が近い値で2つあったらどうする?そして、そのラボでも断固としてそんなことはやらなかった。

余談だが、統計解析で不快だったのは、これは正しくない、と言ってもほとんど信用してもらえなかったことだ。自分の英語が下手なのこともあるかもしれないが、偽陽性・偽陰性・感度・特異度・検定の多重性・誤差の伝播・有意水準・検出力と効果量あたりを正しく理解していない証拠だ。Tukey’s testを使えばスッキリで良いと自分は思うのだが「レビューアーがわかりにくいかもしれないから」という理由で、pairwise t-testを行ってFDRの補正を行ったことがある。「T test」というものに絶大な信頼よせているのだろう。自分は、統計がしっかりしていない研究は引き継ぎなどに絶大な影響を及ぼすと考えている。後に来た人や引き継いだ人というのは、研究に対するバイアスが少ない状態で研究を始めるから、あまりにもわずかな、そして、おかしな統計解析により検出された差を検出、再現できない。これは統計解析に限らず、ブロットや顕微鏡写真などの画像解析にも言えることだ。正しい画像フォーマットで、再現性のある、信頼のある解析手法を使う必要がある。今行っているランダマイゼーションだって、厳密に言えばすこし注意しないといけないと思う。個人的には「腫瘍径」のバイアスとか「匿名化」とかの問題を含んでおり、本当にランダマイゼーションとして機能しているか怪しいと思っている。ただただ既成事実を得るような操作ならば、そんなのやめてほしい。もはや「エセ・ランダマイゼーション」と名付けよう。

自分が断固この手の統計解析をやらないもんだから、おかしな話だが、去年くらいからようやくANOVAやDunnet’s testなんかも認めてくれるようになった。今うちのボスは、一昨年、昨年と人事関係でいろいろあって、かなり柔軟になってきている(定かではないが、おそらくそう。あるときマネージャーに呼ばれていったし、 e-learningでハラスメントについての講習をうけたときに思い当たる節があった。)。おそらく、こういたエセ・ランダマイゼーションもそのうちなくなるのではないかと思う。早くそうなってほしいが、その場合、これまでの研究はどう扱うのか、楽しみだ。

これは日米の「MD, PhD」をうたっている「医者」に多い傾向のような気がする。この「MD, PhD」と言っている「医者」の解析能力は、もっとも他の能力が絶大であればそれは些細な問題のだが、日米問わず要注意だ。ちなみに、これを見破るいい方法がある。実際、統計の専門家などと対等にディスカッションできるかどうかだ。ミーティングなどで、それができなければ、エセと判断するようにしている。本当に、MD, PhDに腐るほど多い。学生のときにこれを知っていたら、どれだけ楽な有利な研究生活だっただろうか。

今日も日頃思っている愚痴を書いてしまった…..まぁ、おそらく誰も見ていないから、いいか。自分のような研究者は、ラボにとっては鬱陶しいんだろうなぁ。前のRAとも統計でモメたことあるし。まぁ気にせんがな。間違ったことは言ってない。