Single SampleのGSEAについて(GSEAPreranked)

日付;2022/10/22(土) 先日、Single Sample(N=1)のRNA-seqは意味があるのか無駄なのかを書いたが、そうは言っても、いろいろな事情によりそのような解析が必要な場合もある。それに、うまく行けばのサンプルの遺伝子発現プロファイルからそのサンプルがどのような細胞や組織に属する推測できるかもしれない。「最終的にお蔵入りになるから無駄だ」とか言っている自分も、結局のところその解 […]

Single sampleのRNA-seqに意味はあるのか

日付;2022/10/16(日)追記;2022/10/22(土) ここ2週間、N=1かつ多群のbulk RNA-seq(以降は単にRNA-seqと示す)の解析を行ってきた。その解析でRNA-seqについて考えたことを記しておこうと思う。以前のポストでも似たようなことを書いており、ある意味「これは問題だな」ということを改めて理解できた 率直な結論 それは、Single Sample(N=1)のRNA […]

SRA Toolkit(sra-tools)のインストールとシークエンスリードのダウンロード

日付;2022/09/19(月)、2022/10/02(日)改定と追記 ゲノム解析で遊ぼうと思っても、肝心なデータがない。そういう場合は、NCBI(National Center for biotechnology Information)のSRA(Sequence Read Achive)からダウンロードして使用する。 しかし、2021年くらいからNCBIが一部データをon-premisesで管 […]

Ubuntu 20.04.4にRNA-seq用のソフト一式をインストールする

日付;2022/08/28(日) 次はUbuntu 20.04.4に、よく使うRNA-seq解析用のソフトをインストールしていく。何か追加でインストールした場合は、ここに追加で記録していくことにする。 RNA-seqのプリプロセッシング用ソフトウェア一式 基本的に、WSL2でUbuntuを入れ、そこにRNA-seqで使用するソフトウェアを入れたときとほぼ同じようにインストールできる(ここ)。まずイ […]

mouse K5にUbuntu20.04.4をインストールする

日付;2022/08/27(土) これはUbuntuを今月(2022年8月)に買ったmouse K5にインストールしたときの記録である。 mouse K5を開けてSSDをインストールする まず、mouse K5を開けて、Macbook Pro 13 inch early 2011のDebian9で使っていたSSDをインストールする。SSDをマウントするための金具を外さなくてはならないのが、微妙にダ […]

WSL2上のUbuntuにRNA-seq解析用のソフトをインストールする

日付;2022/08/22(月) これまでにWindows 11のWindows subsystems for Linux(wsl、バージョン2; wsl2)にUbuntu(20.04)をインストールしたので、 今回はRNA-seqの解析で、特にリードのフィルタリング、リファレンスシークエンス、マッピング、いわゆるプリプロセッシングというヤツに主に使うソフトをインストールしたいと思う。これらは既に […]

Windows 11でWindows Subsystems for Linux(WSL)を使ってUbuntuをインストールする

日付;2022/08/21(日) 今の職場で、32GBの物理メモリを積んだmouse K5というPC、そしてそれにインストールしたWIndows 11を使っている。そしてRNA-seqのデータ解析用には、fastqファイルの処理用にはmacbook pro 13 inch(early 2011)(MBP13)に入ったDebian 9を、その後の高次解析用にはRを使ってきた。しかし、このMBP13は […]

macbook pro (13inch, early 2011)でのRNA-seqが遅すぎて限界なのでmouse K5を購入した

日付;2022/08/20(土) macbook pro (13inch, early 2011)が限界 以下の画像は、今の職場でちょっとした好奇心で行っているRNA-seqの解析の一部であるSTARによるリファレンスシークエンスへのマッピングの結果である。 今年はまだ現職について3か月くらいしか経っていないので、科研費申請を行えるだけの基礎データが、はっきり言って皆無である。それに、その職場がコ […]

Rによるデータ解析(その5)ggplot2によるボックスプロット・箱ひげ図

日付;2022/07/16(土)Rによるデータ解析(その5) ボックスプロット(箱ひげ図)は、N数が10くらいあり、かつ、そのデータが正規分布していないような、というか、動物実験のデータなんかではとても便利なグラフである。また、エクセルでこのボックスプロットを作成しようとしてもなかなか難しい作図の一つであると思う。N=10くらいのデータでは、データを要約しようと思うと、平均値±標準偏差よりもデータ […]

Rによるデータ解析(その4)ggplot2による棒グラフの作成方法

日付;2022/07/15(土)Rによるデータ解析(その4) 最近では、どうもNatureやCellやScienceだけではなく、他のジャーナルでも棒グラフに個々のデータをいプロットする論文が増えてきた。ジャーナル側からの要求なのか、それともただイキってNature、Cell、Scienceを真似しているだけなのかは知らない。 尚、基礎生物学研究必要なのは平均値と標準偏差であると確信している。そし […]