日付;2021/05/10(月)
RNA-seq解析用PC(Dell Precision M4800)が瀕死である。前回はVirtualBoxに使い慣れたDebian 9をインストールし、さらに基本的なソフトウェアもインストールした。今日は、RNA-seq解析に用いているソフトを一通りインストールする。自分は主にpreprocessingにDebianを用いてきた。マッピング後の解析についてはMacbook Pro 15 inchで行っている。
Fastqc
バイナリーファイルをここからダウンロードする。
解凍してできたフォルダを任意のフォルダに移動する。
マニュアルに従い、Permissionを変更する。
chmod 755 /home/……/fastqc
パスを通す。
su
pwd
cd
gedit .bashrc
PATH=$PATH:/home/……… #これを追加。
source .bashrc
echo $PATH
Trimmomatic
最近の解析ではTrimmomatic-0.39を使っていた。なので、最新ではないがこれをインストールしようと思う。
まず、バイナリーファイルをここからダウンロード(http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.39.zip)し、解凍、任意のフォルダに移動し、パスを通す。以上。
実行はjava -jar /home/….trimmomatic-0.39.jar
簡単。
PRINSEQ++
普通のPRINSEQはクソ遅いが、PRINSEQ++はC++で書かれているらしく(詳しくは知らん)、普通のPRINSEQよりかなり早い。なので、PRINSEQ++が断然良い。
ここのこれ(https://github.com/Adrian-Cantu/PRINSEQ-plus-plus/releases/download/v1.2/prinseq-plus-plus-1.2.tar.gz)をダウンロードする。バイナリーを使う場合はこれ(https://github.com/Adrian-Cantu/PRINSEQ-plus-plus/releases/download/v1.2/binary_prinseq-plus-plus-1.2.tar.gz)。
インストールには以下のパッケージが必要。
apt-get install g++
apt-get install make
apt-get install libboost-all-dev
apt-get install libpthread-stubs0-dev
その他、どうやらzlibが必要らしいので、ここからダウンロードする。
ダウンロード後、解凍し、任意のフォルダに移して以下によりzlibをインストール。
cd /home…../zlib
./configure
make
make install
次に、prinseq++をインストール
cd /home/……../prinseq-plus-plus-1.2
./configure
make
make test
sudo make install
最後にパスを通す。
STAR
STARは2.7.7aを使っていたので、そのソースをここからダウンロードして、任意のフォルダに移動させる。
次にsourceに移動し、マニュアルに従いコンパイルする。
cd /home/……./STAR-2.7.7a/source
make STAR
イントール後、チェック。
STAR -h
簡単。
subread
ここからダウンロードして解凍、任意のフォルダに移動してパスを通す。以上
featureCountsをよく使うので、確認してみる。
featureCounts -h
簡単。
Anaconda
言うてもマッピング後の解析はすべてMacbook Pro 15inchで行うつもりであるが、これがあればかなり便利な気がする。
ここからダウンロードして任意のフォルダに移動して以下によりインストール。
bash Anaconda3-2020.11-Linux-x86_64.sh
以下、全部yes.
Terminalを再起動したらcondaが動いた。
これも簡単。
samtools
自分はsamtools-1.11を使っていたらしいので、それをここからダウンロード。
解凍し、任意のフォルダにコピーして、マニュアルに従い、そこにインストール。
./configure –prefix=/home/……../samtools-1.11/
make
しかし、以下のヘッダーが使えないとかいうエラーがでた。
ncurse.h
lzma.h
curl.h
Curlって、めちゃくちゃベーシックなヤツじゃあないのか?あまりにもDebian 9にインストールされていないパッケージが多い。Debian 9のインストール時になにか忘れたんだろうか….
そういう事なので、必要なパッケージをインストールした。
apt-get install libghc-ncurses-dev
apt-get install libncurses5-dev
apt-get install lzma
apt-get install lzma-dev
apt-get install xz-utils
apt-get install curl
たしか、こんなところを試したんだと思う。あまり覚えていない。
それでもう一度以下を流して、インストール完了。
./configure –prefix=/home/……/samtools-1.11/
make
make install
それでパスを通して完了。念のために以下を流してみたらイケたので完了とみなす。
samtools view -h
以下でプログラムは動いた。
fastqc
STAR
samtools
java -jar /home/……/trimmomatic-0.39.jar
たまにうまくプログラムが走らないときがあるが、そんなときは面倒なのでフルパスをいれるか、./STARとかいれて起動させようと思う。特にtrimmomatic-0.39がそう。which trimmomatic-0.39.jarでパスを見つけることが出来る。まぁ、予備だし、それでいいか。そもそも、メモリ8GB(とSWAP領域)なんかで行う解析なんて、どのくらい時間かかるかわからん。それでもどうしても必要になったら、このシステムを使おうと思う。
次はこの構成でSTARのindex作成にどのくらいの時間が必要なのか、メモリ8GBとSWAP領域の実力を測ってみたいと思う。