VirtualBox中のDebian 9にRNA-seq用のソフトをインストールする

日付;2021/05/10(月)

RNA-seq解析用PC(Dell Precision M4800)が瀕死である。前回はVirtualBoxに使い慣れたDebian 9をインストールし、さらに基本的なソフトウェアもインストールした。今日は、RNA-seq解析に用いているソフトを一通りインストールする。自分は主にpreprocessingにDebianを用いてきた。マッピング後の解析についてはMacbook Pro 15 inchで行っている。

Fastqc

バイナリーファイルをここからダウンロードする。

解凍してできたフォルダを任意のフォルダに移動する。

マニュアルに従い、Permissionを変更する。

chmod 755 /home/……/fastqc

パスを通す。

su
pwd
cd
gedit .bashrc
PATH=$PATH:/home/……… #これを追加。
source .bashrc
echo $PATH

Trimmomatic

最近の解析ではTrimmomatic-0.39を使っていた。なので、最新ではないがこれをインストールしようと思う。

まず、バイナリーファイルをここからダウンロード(http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.39.zip)し、解凍、任意のフォルダに移動し、パスを通す。以上。

実行はjava -jar /home/….trimmomatic-0.39.jar

簡単。

PRINSEQ++

普通のPRINSEQはクソ遅いが、PRINSEQ++はC++で書かれているらしく(詳しくは知らん)、普通のPRINSEQよりかなり早い。なので、PRINSEQ++が断然良い。

ここのこれ(https://github.com/Adrian-Cantu/PRINSEQ-plus-plus/releases/download/v1.2/prinseq-plus-plus-1.2.tar.gz)をダウンロードする。バイナリーを使う場合はこれ(https://github.com/Adrian-Cantu/PRINSEQ-plus-plus/releases/download/v1.2/binary_prinseq-plus-plus-1.2.tar.gz)。

インストールには以下のパッケージが必要。

apt-get install g++
apt-get install make
apt-get install libboost-all-dev
apt-get install libpthread-stubs0-dev

その他、どうやらzlibが必要らしいので、ここからダウンロードする。

ダウンロード後、解凍し、任意のフォルダに移して以下によりzlibをインストール。

cd /home…../zlib
./configure
make
make install

次に、prinseq++をインストール

cd /home/……../prinseq-plus-plus-1.2
./configure
make
make test
sudo make install

最後にパスを通す

STAR

STARは2.7.7aを使っていたので、そのソースをここからダウンロードして、任意のフォルダに移動させる。

次にsourceに移動し、マニュアルに従いコンパイルする。

cd /home/……./STAR-2.7.7a/source
make STAR

イントール後、チェック。

STAR -h

簡単。

subread

ここからダウンロードして解凍、任意のフォルダに移動してパスを通す。以上

featureCountsをよく使うので、確認してみる。

featureCounts -h

簡単。

Anaconda

言うてもマッピング後の解析はすべてMacbook Pro 15inchで行うつもりであるが、これがあればかなり便利な気がする。

ここからダウンロードして任意のフォルダに移動して以下によりインストール。

bash Anaconda3-2020.11-Linux-x86_64.sh

以下、全部yes.

Terminalを再起動したらcondaが動いた。

これも簡単。

samtools

自分はsamtools-1.11を使っていたらしいので、それをここからダウンロード。
解凍し、任意のフォルダにコピーして、マニュアルに従い、そこにインストール。

./configure –prefix=/home/……../samtools-1.11/
make

しかし、以下のヘッダーが使えないとかいうエラーがでた。
ncurse.h
lzma.h
curl.h

Curlって、めちゃくちゃベーシックなヤツじゃあないのか?あまりにもDebian 9にインストールされていないパッケージが多い。Debian 9のインストール時になにか忘れたんだろうか….

そういう事なので、必要なパッケージをインストールした。

apt-get install libghc-ncurses-dev
apt-get install libncurses5-dev
apt-get install lzma
apt-get install lzma-dev
apt-get install xz-utils
apt-get install curl

たしか、こんなところを試したんだと思う。あまり覚えていない。

それでもう一度以下を流して、インストール完了。

./configure –prefix=/home/……/samtools-1.11/
make
make install

それでパスを通して完了。念のために以下を流してみたらイケたので完了とみなす。

samtools view -h

以下でプログラムは動いた。

fastqc
STAR
samtools
java -jar /home/……/trimmomatic-0.39.jar

たまにうまくプログラムが走らないときがあるが、そんなときは面倒なのでフルパスをいれるか、./STARとかいれて起動させようと思う。特にtrimmomatic-0.39がそう。which trimmomatic-0.39.jarでパスを見つけることが出来る。まぁ、予備だし、それでいいか。そもそも、メモリ8GB(とSWAP領域)なんかで行う解析なんて、どのくらい時間かかるかわからん。それでもどうしても必要になったら、このシステムを使おうと思う。

次はこの構成でSTARのindex作成にどのくらいの時間が必要なのか、メモリ8GBとSWAP領域の実力を測ってみたいと思う。