基礎医学・生物学研究の研究者として留学・実験・学会・論文作成・日頃の研究活動で経験したことをブログに記録していきます。 クオリティーやサポート向上などのため一部の記事をcodocで有料化しました。

edgeRによる遺伝子発現解析・GSEAとclusterProfierによるパスウェイ解析

日付;2025/02/11(火) はじめに 先日、RNA-seqの解析でのFASTQのQC、アダプター除去(アダプタートリミング)、ゲノムへのマッピングの方法を記した。ここでは、それに引き続く解析であるedgeRによる遺伝子発現解析の方法、GSEAを使ったGSEA(Gene Set Enrichment Analysis)、clusterProfilerを使ったOverrepresentation […]

RNA-seqの解析におけるFASTQのQC・アダプター配列の除去・マッピング・リードカウントの方法

日付;2025/01/11(土)、2025/01/30(木)タイトル修正 はじめに 小さな研究室やアカデミックではRNA-seqの解析のためにN=5で2グループ取ることができれば上等で、経費を抑えるためにN=3や、最悪ではあるがN=2や1で解析を計画してしまうことも少なくないように思う。しかし、今回はそういうことはなく、N=5で合計40サンプルで行うことができた。しかし、こういった場合はやはり一連 […]

pdc-clientを使ってCPTACの公開データをダウンロードする

日付;2024/10/27(日) はじめに 最近では、ナノポアシークエンサーでアミノ酸配列まで読めるようになってきた。これはつまり、プロテオームもハイスループットで読める時代がもうそこまで来てるってことである。現時点ではマルチプレックスのプロテオームはRNAシークエンスの価格の10倍くらいするので、なかなか手を出せる物でもない。しかし、こうやってハイスループットのタンパク質発現解析方法が開発されれ […]

gdc-clientを使ってTCGAの公開データをダウンロードする

日付;2024/10/26(土) はじめに TCGA(The Cancer Genome Atlas Program)は公的データベースであり、誰でも利用可能である。トランスレーショナルスタディーや、それに限らず基礎研究に対してもこんなに有用なものはない。オープンアクセスのデータだけでなく、限られたユーザーがアクセスできるデータ(Controlled data;オープンアクセスではないデータ)もあ […]

RによるssGSEA(single sample Gene Set Enrichment Analysis)とその方法

日付;2024/06/23(日) はじめに これまでにBroad instituteのGSEAによりGSEAを行う方法をそれぞれ複数サンプルからなる2群間比較の場合と1群のみの場合について書いたが、ここではRを使ってsingle sample GSEA(ssGSEA)する方法を述べる。ちなみに、以前書いたBroad instituteのGSEA Prerankedを使った解析はN数を1とか2しか採 […]

GSEA(Gene Set Enrichment Analysis)の手順と結果の見方

日付;2024/05/26(日)、2025/02/15(土)他の記事でもGSEAを書いたことを記載。 以前、Preranked GSEA(Gene Set Enrichment Analysis)について時々使う必要があるために覚書として記載したが、そいうえば、複数サンプルの場合の一般的なGSEAについては書いたことがなかったためにここで記載しておく。データのフォーマットとか、どの変数に何を入れる […]

RNAシークエンス解析関連のおすすめライブラリ

日付;2024/05/19(日) 何かの標的分子と疾患との関連を知りたい場合、結局のところ通常のRNA-seqなどを利用する場合が多い。なので、一般的な遺伝子発現解析ツールも準備する必要がある。最近ではRNA-seqもかなり普通になってきたので、以下のライブラリで通常のことは出来るように思う。ちなみに、以下のソフトを使った解析で一貫性のある結果が得られた場合、それは生物学的に有意であり、すぐにでも […]

シングルセルRNAシークエンス解析で使用するおすすめRライブラリ

日付;2024/04/28(日) 先日にPythonを用いたシングルセルRNAシークエンス(scRNA-seq)解析のためのパッケージをインストールした。その記事はここに記したので、PythonでシングルセルRNAシークエンスのデータを解析したい方は、それを参考にしていただきたい。Pythonのパッケージは比較的(最近ではもう随分と安定してきたように思う。だから「比較的」という言葉を使う必要がある […]

Githubの使い方

日付;2024/04/27(土) 今日、さすがにGithubを使い出した。セットアップが結構勉強になったので、そのときの日記。 Githubの必要性を感じる 最近自分はつくづく医学系の基礎研究者だなぁ(つまり、コンピューター解析の研究者や開発者ではなく)と思う。だからこそ、これまで大規模なコードなんか書かずに、すなわち、Gitを使ってログなんかを取らずに必要性だけでコンピューター解析を行ってきたの […]

シングルセルRNAシークエンスで使用するPythonパッケージをインストールする

日付;2024/04/28(土) シングルセルRNAシークエンス(scRNA-seq)を解析するためには、RかPythonを使うのが一般的である。最近では先進的な解析手法はPythonで実装されることが多いように思う。velocyte(Rもあるようだが、以前試したときにインストール出来なかった。そもそもpythonで使う予定だったので、深追いしていない。)やscVeloはRNA velocity解 […]

Seurat v.5をインストールする

日付;2024/04/06(土) 以前はSeuratのversion 4を使っていたけど、それももうversion 5(v.5.0.2)になって数ヶ月がたった。そういうことなので、ここでもバージョン5をインストールしようと思う。version 4との違いとしては、sctransformがデフォルトでv. 2になった(version 4ではgithub経由で別途インストールしなければならなかった。) […]

cellranger countによるfastqからカウントマトリックスの作成方法

シングルセルRNAシークエンスのリードをリファレンスシークエンスへマッピングし、リードカウントをやってくれるパイプラインがcellranger countである。ここでは、シークエンスから返ってきた、もしくはcellranger mkfastqなどで適切に作成したfastqファイルを、cellranger countで処理することでカウントマトリックスを作成する方法について記す。個人的に思うのが、 […]

cellranger mkfastqでBCLファイルをFASTQファイルに変換する

日付;2023/02/25(土)、2023/02/28(火)訂正、2024/03/31(日)有料化 一般的に、シングルセルRNAシークエンスの実験は、特に10xGenomicsのライブラリ調整キットを使用している場合、Chromium controllerを用いたエマルジョン作成に始まり、その後のライブラリ調整、最後にシークエンスを外注して、最終的に、Dual Indexを付けた場合はサンプルあた […]

Cell Rangerとbcl2fastq2のインストール

日付;2023/02/24(金) 日付;2024/03/31(日);有料化 シングルセルRNAシークエンスでは、一般的にはシークエンスの結果は使用したライブラリ調整キットに応じたインデックスファイル(I1、I2.fastq)とcDNAのリード(R1.fastq、R2.fastq)の4つ(実際はこれらのファイル名にレーンやサンプルの情報が入っているはず。)が、サンプルあたり返ってくる。それらをリファ […]

monocle3のインストール

日付;2022/10/30(日)、2024/03/31(日)有料化 Single cell RNA sequence(scRNA-seq)の解析を行うための代表的なソフトの一つにmonocle3がある。最も王道のツールとしてSeurat、その次にこのmonocle3が挙げられるような感じがする。実は、Seuratもmonocle3も、マニュアルに目を通した程度しか知らないのだが、印象としてはこのm […]

Seuratのインストール

日付;2022/10/29(土)、2024/03/31(日)有料化 single cell RNA sequenceの解析を行うためには、いくつかのソフトをインストールする必要がある。自分は仕事で10xGenomicsのライブラリー作成キット(Chromium Single Cell 3′ Reagent Kits User Guide (v3.1))を使っている関係から、もはやcel […]

Single SampleのGSEAについて(GSEAPreranked)

日付;2022/10/22(土)、2024/03/31(日)有料化、2024/06/08(土)Leading edge analysisについて追記 先日、Single Sample(N=1)のRNA-seqは意味があるのか無駄なのかを書いたが、そうは言っても、いろいろな事情によりそのような解析が必要な場合もある。それに、うまく行けばのサンプルの遺伝子発現プロファイルからそのサンプルがどのような細 […]

SRA Toolkit(sra-tools)のインストールとシークエンスリードのダウンロード

日付;2022/09/19(月)、2022/10/02(日)改定と追記、2024/03/31(日)有料化 ゲノム解析で遊ぼうと思っても、肝心なデータがない。そういう場合は、NCBI(National Center for biotechnology Information)のSRA(Sequence Read Achive)からダウンロードして使用する。 しかし、2021年くらいからNCBIが一部 […]

Uniprotでタンパク質のMSA(Multiple Sequence Alignment)を行う

日付;2025/03/16(日) Uniprotを使った簡単なMSA(Multiple Sequence Alighment) 仕事で現在行っているプロジェクトが一段落しそうな雰囲気が出来てきた。この仕事をやりきった上で今年の7月に夏休みをとろうって感じになっている。そして、そのプロジェクトが一段落する時点で、タンパク質-タンパク質相互作用(Protein-Protein Interaction; […]

Geforce RTX3060のドライバーを更新する

日付;2024/12/14(土) はじめに 現在使用しているコンピューターには最安Geforce RTX3060が積んである。このコンピューターを組んだとき、インターネットで引っかかってきた情報を元に、とりあえず、特に何も考えずにsudo apt unstall nvidia-driver-535したのだが、それではcuda 12.2のようだ。諸事上によりcuda 12.6がほしく、そのためにve […]

cellranger countがメモリ不足で止まる場合の対処方法

日付;2024/12/7(土)、2024/12/10(火)SWAPパーティションの導入によりSWAPが動くようになった、2024/12/12(木)結局キャシュの定期クリアを設定する、2024/12/22(日)ちゃんとSWAPが利用されていた。 はじめに 最近、新しいPCでcellranger 9.0.0を使い出した。cellranger 9.0.0には、新しくcellranger anniotat […]

Ryzen 9 9950Xで解析用コンピューターを組んだ

日付;2024/11/04(月)、2024/11/24(日)LAN Driverについて追記、2024/12/04(水)psensorによるモニタリングについて追記、2024/12/08(日)psensorではなくメモリ不足にだったことを追記 はじめに これまで、マウスコンピューターのmouse K5というラップトップで解析を行ってきたが、これでTCGAなどのように数千人のデータだったり、シングル […]

SWAP領域の設定

日付;2024/10/25(金) ゲノム、RNAシークエンス、シングルセルRNAシークエンス、TCGA等の公開データの解析では、一般的なコンピューターよりもかなり大量のメモリが必要になる。サンプル数や症例数が10程度であればメモリを64GB程度積んだコンピューターでも可能であるが、結局物理メモリをほぼ使い果たしてしまうと思う。昨今では128GB以上メモリを積むことができるようになってきているが、そ […]