- 2026年5月11日
- 2026年6月2日
CPTACのデータとRを使ってがんや腫瘍のタンパク質発現量と患者の生存率の関係を解析する(CPTAC, v.4.4, 2024)
この投稿はパスワードで保護されているため抜粋文はありません。
この投稿はパスワードで保護されているため抜粋文はありません。
2026/01/03(土);初稿2026/01/12(月);追記;AnndataではなくSummerizeExperimentやMultipleAssayExperimentが使えると思う。 はじめに 以前、TCGAのデータを使って、がんや腫瘍における遺伝子発現量(RNA-seqのカウント値)と患者の生存率の関係をRで解析したが、そのときは対応する正常組織(おそらくがんや腫瘍周辺の正常部位)におけ […]
2025/12/14(日);初稿2025/12/29(月);訂正;カプランマイヤー法による生存率の解析;教科書(生存期間解析、ISBN978-4-254-12861-1)に従って、打ち切りの設定を確認し、生存曲線(カプランマイヤー推定値)の横軸を1825日(5年)に限定した。2026/01/03(土);訂正;元の記事のタイトル「TCGAのデータとRを使ってがんや腫瘍の遺伝子発現量と患者の生存率の関 […]
2025/10/04(土);初稿2025/11/08(土);追記;並列化が元から組み込まれているライブラリに対してforeachを使うのはそもそも良くない。 はじめに 以前TCGAやCPTACのデータをダウンロードしたが、最近はこれまで解析を行ってきた解析手順や手法をブログに記録しておくためそのデータを使って色々と解析を行っている。今後のためにと思って、多少無茶な解析でも行っているわけだが、そのと […]
日付;2025/02/11(火) はじめに 先日、RNA-seqの解析でのFASTQのQC、アダプター除去(アダプタートリミング)、ゲノムへのマッピングの方法を記した。ここでは、それに引き続く解析であるedgeRによる遺伝子発現解析の方法、GSEAを使ったGSEA(Gene Set Enrichment Analysis)、clusterProfilerを使ったOverrepresentation […]
日付;2025/01/11(土)、2025/01/30(木)タイトル修正 はじめに 小さな研究室やアカデミックではRNA-seqの解析のためにN=5で2グループ取ることができれば上等で、経費を抑えるためにN=3や、最悪ではあるがN=2や1で解析を計画してしまうことも少なくないように思う。しかし、今回はそういうことはなく、N=5で合計40サンプルで行うことができた。しかし、こういった場合はやはり一連 […]
2024/12/7(土);初稿2024/12/10(火);SWAPパーティションの導入によりSWAPが動くようになった。2024/12/12(木);結局キャシュの定期クリアを設定する。2024/12/22(日);ちゃんとSWAPが利用されていた。 2025/09/28(日); crontabのところを訂正。 はじめに 最近、新しいPCでcellranger 9.0.0を使い出した。cellrang […]
2024/10/27(日);初稿2026/01/06(火);データのバージョン追記、タイトルを変更、サムネイル変更 はじめに 最近では、ナノポアシークエンサーでアミノ酸配列まで読めるようになってきた。これはつまり、プロテオームもハイスループットで読める時代がもうそこまで来てるってことである。現時点ではマルチプレックスのプロテオームはRNAシークエンスの価格の10倍くらいするので、なかなか手を出せる […]
2024/10/26(土);初稿2026/01/06(火);タイトル変更、サムネイル変更 はじめに TCGA(The Cancer Genome Atlas Program)は公的データベースであり、誰でも利用可能である。トランスレーショナルスタディーや、それに限らず基礎研究に対してもこんなに有用なものはない。オープンアクセスのデータだけでなく、限られたユーザーがアクセスできるデータ(Contro […]
日付;2024/06/23(日)、2025/04/03(木)ssGSEA2に使用するGCTファイルについて追記 はじめに これまでにBroad instituteのGSEAによりGSEAを行う方法をそれぞれ複数サンプルからなる2群間比較の場合と1群のみの場合について書いたが、ここではRを使ってsingle sample GSEA(ssGSEA)する方法を述べる。ちなみに、以前書いたBroad in […]
日付;2024/05/26(日)、2025/02/15(土)他の記事でもGSEAを書いたことを記載。 以前、Preranked GSEA(Gene Set Enrichment Analysis)について時々使う必要があるために覚書として記載したが、そいうえば、複数サンプルの場合の一般的なGSEAについては書いたことがなかったためにここで記載しておく。データのフォーマットとか、どの変数に何を入れる […]
日付;2024/05/19(日) 何かの標的分子と疾患との関連を知りたい場合、結局のところ通常のRNA-seqなどを利用する場合が多い。なので、一般的な遺伝子発現解析ツールも準備する必要がある。最近ではRNA-seqもかなり普通になってきたので、以下のライブラリで通常のことは出来るように思う。ちなみに、以下のソフトを使った解析で一貫性のある結果が得られた場合、それは生物学的に有意であり、すぐにでも […]
日付;2024/04/28(日) 先日にPythonを用いたシングルセルRNAシークエンス(scRNA-seq)解析のためのパッケージをインストールした。その記事はここに記したので、PythonでシングルセルRNAシークエンスのデータを解析したい方は、それを参考にしていただきたい。Pythonのパッケージは比較的(最近ではもう随分と安定してきたように思う。だから「比較的」という言葉を使う必要がある […]
日付;2024/04/27(土) 今日、さすがにGithubを使い出した。セットアップが結構勉強になったので、そのときの日記。 Githubの必要性を感じる 最近自分はつくづく医学系の基礎研究者だなぁ(つまり、コンピューター解析の研究者や開発者ではなく)と思う。だからこそ、これまで大規模なコードなんか書かずに、すなわち、Gitを使ってログなんかを取らずに必要性だけでコンピューター解析を行ってきたの […]
日付;2024/04/28(土) シングルセルRNAシークエンス(scRNA-seq)を解析するためには、RかPythonを使うのが一般的である。最近では先進的な解析手法はPythonで実装されることが多いように思う。velocyte(Rもあるようだが、以前試したときにインストール出来なかった。そもそもpythonで使う予定だったので、深追いしていない。)やscVeloはRNA velocity解 […]
日付;2024/04/06(土) 以前はSeuratのversion 4を使っていたけど、それももうversion 5(v.5.0.2)になって数ヶ月がたった。そういうことなので、ここでもバージョン5をインストールしようと思う。version 4との違いとしては、sctransformがデフォルトでv. 2になった(version 4ではgithub経由で別途インストールしなければならなかった。) […]
日付;2024/03/24(日) 今では遺伝子発現解析やゲノム解析は、生物・医学研究を行うためには必須の解析技術となっている。さらに、近年はコンピューターの処理能力も十分に高くなっているため、一般的な解析であれば、大きなサーバーを使用せずとも、少し良いゲーミング用コンピューターでも実施可能になってきている。そういうことなので、うちでもマイクロアレイ、一般的なRNAシークエンス(バルク)やシングルセ […]
Data; 2023/05/25(Thu) Recently I have used scanpy for analyzing single cell RNA sequence (scRNA-seq). I feel staistical analysis on scanpy is less useful than Seurat, but scanpy has really nice compat […]
シングルセルRNAシークエンスのリードをリファレンスシークエンスへマッピングし、リードカウントをやってくれるパイプラインがcellranger countである。ここでは、シークエンスから返ってきた、もしくはcellranger mkfastqなどで適切に作成したfastqファイルを、cellranger countで処理することでカウントマトリックスを作成する方法について記す。個人的に思うのが、 […]
日付;2023/02/25(土)2023/02/28(火)訂正2024/03/31(日)有料化2026/05/22(金)cellranger 10.0.0ではcellranger mkfastqがdeprecateされたことを追記 はじめに 一般的に、シングルセルRNAシークエンスの実験は、特に10xGenomicsのライブラリ調整キットを使用している場合、Chromium controllerを […]
日付;2023/02/24(金) 日付;2024/03/31(日);有料化 シングルセルRNAシークエンスでは、一般的にはシークエンスの結果は使用したライブラリ調整キットに応じたインデックスファイル(I1、I2.fastq)とcDNAのリード(R1.fastq、R2.fastq)の4つ(実際はこれらのファイル名にレーンやサンプルの情報が入っているはず。)が、サンプルあたり返ってくる。それらをリファ […]
日付;2022/10/30(日)、2024/03/31(日)有料化 Single cell RNA sequence(scRNA-seq)の解析を行うための代表的なソフトの一つにmonocle3がある。最も王道のツールとしてSeurat、その次にこのmonocle3が挙げられるような感じがする。実は、Seuratもmonocle3も、マニュアルに目を通した程度しか知らないのだが、印象としてはこのm […]
日付;2022/10/29(土)、2024/03/31(日)有料化 single cell RNA sequenceの解析を行うためには、いくつかのソフトをインストールする必要がある。自分は仕事で10xGenomicsのライブラリー作成キット(Chromium Single Cell 3′ Reagent Kits User Guide (v3.1))を使っている関係から、もはやcel […]
日付;2022/10/22(土)、2024/03/31(日)有料化、2024/06/08(土)Leading edge analysisについて追記 先日、Single Sample(N=1)のRNA-seqは意味があるのか無駄なのかを書いたが、そうは言っても、いろいろな事情によりそのような解析が必要な場合もある。それに、うまく行けばのサンプルの遺伝子発現プロファイルからそのサンプルがどのような細 […]
日付;2022/09/19(月)、2022/10/02(日)改定と追記、2024/03/31(日)有料化 ゲノム解析で遊ぼうと思っても、肝心なデータがない。そういう場合は、NCBI(National Center for biotechnology Information)のSRA(Sequence Read Achive)からダウンロードして使用する。 しかし、2021年くらいからNCBIが一部 […]
2026/5/17(日);初稿 はじめに 気づいたときに何の前触れもなく、パッと行う必要がある解析として、相関係数の算出がある。しかし、これも計算しては忘れることを繰り返している様に思う。依って、ここに覚書しておく。以下はデータフレームdfの列column1と列column2の散布図を描き、そこに単回帰(y = ax +b)を求めて、それを散布図に重ねるためのRのコードである。単回帰と相関係数は、 […]
はじめに 遺伝子発現プロファイルでも、タンパク質発現プロファイルでもそうだが、解析していると正規化(Normalization)という操作が必要になる。遺伝子発現解析をしているとそこまで問題になることはないし(いや、実際は大問題で、正規化に関する論文は沢山ある。問題無いと書いたが、それは対照群と比較群が同じようにデータ取得されていて、かつ、それらの論文で示される正規化方法が使える場合はとやかく考え […]
2026/02/22(日);初稿 はじめに 2026年2月21日(土)から23日(月)までは日本では3連休である。しかしながら、自分はこの3日間仕事がある。いや、別にやらなくてもいいんだが、マウスが死んでしまうので、それをのがしたら正確なデータを得ることが出なくなる。会社なので本当ならば正式な手続きを経て休日出勤を行う必要がある。でも、金曜日の夜にその判断をせざるを得なかったので、申請なんかできる […]
2026/02/04(水);初稿 SE 90PCIを使いたい 去年か一昨年に、SE 90PCI(オンキョー)のサウンドカードを実家から持ってきた。これは、20年位前に買ったもので、DELLのロープロファイルのPCに入れていたものである。昔は聞く音楽の音にずいぶんこだわっていて、少ない所持金ながらもギリギリいい音で音楽を再生して聞いていたわけである。確か当時はこれ11000円くらいだった気がする。そ […]
2026/01/17(土);初稿2026/05/22(金);日付の表示の設定を追記 はじめに 自分は今、仕事ではWindows 11を使用している。今や世界中のユーザーが「〇〇」という評価を下しつつある、あのWindows 11である。不便でありながら、しゃあなしでこのOSを仕事で使用している人も非常に、異常なほど多いと思う。自分も今はWindows 11を使用しており、特に、そんなOSに付属して […]
日付;2025/10/06(月) はじめに 2つ目の創薬ベンチャーに転職することにした理由を覚書しておこう思う。特に面白いことを書いているわけではないが、こうやって記録しておかないとどうしても後で忘れてしまう。これは自分が2社目のベンチャーに転職に至った理由を書いたものであり、同時に、創薬ベンチャーが短期間で何らかの成果を残し収益につなげるうえでの実際の落とし穴の一例と考えている。 この会社の人た […]