VirtualBox中のDebian 9にRNA-seq用のソフトをインストールする

日付;2021/05/10(月)

はじめに

RNA-seq解析用PC(Dell Precision M4800)が瀕死である。前回はVirtualBoxに使い慣れたDebian 9をインストールし、さらに基本的なソフトウェアもインストールした。今日は、RNA-seq解析に用いているソフトを一通りインストールする。自分は主にpreprocessingにDebianを用いてきた。マッピング後の解析についてはMacbook Pro 15 inchで行っている。

Fastqc

バイナリーファイルをここからダウンロードする。

解凍してできたフォルダを任意のフォルダに移動する。

マニュアルに従い、Permissionを変更する。

Bash
chmod 755 /home/....../fastqc
Bash

パスを通す。

Bash
su
pwd
cd
gedit .bashrc
PATH=$PATH:/home/......... #これを追加。
source .bashrc
echo $PATH
Bash

Trimmomatic

最近の解析ではTrimmomatic-0.39を使っていた。なので、最新ではないがこれをインストールしようと思う。

まず、バイナリーファイルをここからダウンロード(http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.39.zip)し、解凍、任意のフォルダに移動し、パスを通す。以上。

実行はjava -jar /home/….trimmomatic-0.39.jar

簡単。

PRINSEQ++

普通のPRINSEQはクソ遅いが、PRINSEQ++はC++で書かれているらしく(詳しくは知らん)、普通のPRINSEQよりかなり早い。なので、PRINSEQ++が断然良い。

ここのこれ(https://github.com/Adrian-Cantu/PRINSEQ-plus-plus/releases/download/v1.2/prinseq-plus-plus-1.2.tar.gz)をダウンロードする。バイナリーを使う場合はこれ(https://github.com/Adrian-Cantu/PRINSEQ-plus-plus/releases/download/v1.2/binary_prinseq-plus-plus-1.2.tar.gz)。

インストールには以下のパッケージが必要。

Bash
apt-get install g++
apt-get install make
apt-get install libboost-all-dev
apt-get install libpthread-stubs0-dev
Bash

その他、どうやらzlibが必要らしいので、ここからダウンロードする。

ダウンロード後、解凍し、任意のフォルダに移して以下によりzlibをインストール。

Bash
cd /home…../zlib
./configure
make
make install
Bash

次に、prinseq++をインストール

Bash
cd /home/......../prinseq-plus-plus-1.2
./configure
make
make test
sudo make install
Bash

最後にパスを通す

STAR

STARは2.7.7aを使っていたので、そのソースをここからダウンロードして、任意のフォルダに移動させる。

次にsourceに移動し、マニュアルに従いコンパイルする。

Bash
cd /home/......./STAR-2.7.7a/source
make STAR
Bash

イントール後、チェック。

Bash
STAR -h
Bash

簡単。

subread

ここからダウンロードして解凍、任意のフォルダに移動してパスを通す。以上

featureCountsをよく使うので、確認してみる。

Bash
featureCounts -h
Bash

簡単。

Anaconda

言うてもマッピング後の解析はすべてMacbook Pro 15inchで行うつもりであるが、これがあればかなり便利な気がする。

ここからダウンロードして任意のフォルダに移動して以下によりインストール。

Bash
bash Anaconda3-2020.11-Linux-x86_64.sh
Bash

以下、全部yes.

Terminalを再起動したらcondaが動いた。

これも簡単。

samtools

自分はsamtools-1.11を使っていたらしいので、それをここからダウンロード。
解凍し、任意のフォルダにコピーして、マニュアルに従い、そこにインストール。

Bash
./configure --prefix=/home/......../samtools-1.11/
make
Bash

しかし、以下のヘッダーが使えないとかいうエラーがでた。
ncurse.h
lzma.h
curl.h

Curlって、めちゃくちゃベーシックなヤツじゃあないのか?あまりにもDebian 9にインストールされていないパッケージが多い。Debian 9のインストール時になにか忘れたんだろうか….

そういう事なので、必要なパッケージをインストールした。

Bash
apt-get install libghc-ncurses-dev
apt-get install libncurses5-dev
apt-get install lzma
apt-get install lzma-dev
apt-get install xz-utils
apt-get install curl
Bash

たしか、こんなところを試したんだと思う。あまり覚えていない。

それでもう一度以下を流して、インストール完了。

Bash
./configure --prefix=/home/....../samtools-1.11/
make
make install
Bash

それでパスを通して完了。念のために以下を流してみたらイケたので完了とみなす。

samtools view -h

以下でプログラムは動いた。

fastqc
STAR
samtools
java -jar /home/……/trimmomatic-0.39.jar

たまにうまくプログラムが走らないときがあるが、そんなときは面倒なのでフルパスをいれるか、./STARとかいれて起動させようと思う。特にtrimmomatic-0.39がそう。which trimmomatic-0.39.jarでパスを見つけることが出来る。まぁ、予備だし、それでいいか。そもそも、メモリ8GB(とSWAP領域)なんかで行う解析なんて、どのくらい時間かかるかわからん。それでもどうしても必要になったら、このシステムを使おうと思う。

次はこの構成でSTARのindex作成にどのくらいの時間が必要なのか、メモリ8GBとSWAP領域の実力を測ってみたいと思う。