メモ: リードカウントデータの正規化について
17 May 2019追記
メモした内容で実際に正規化してみた
mecobalamin.hatenablog.com
mecobalamin.hatenablog.com
追記ここまで
featureCountsでリードカウントしたあとに
複数のデータを比較する場合、
カウントの正規化が必要らしい
まだ良くわかってないので
参考にしているサイトのリンクを張っておく
ペアエンドのサンプルをリードカウントするときのコマンドがあった
featureCounts
RNA seqのリードカウント featureCounts - macでインフォマティクス
正規化の方法にはRLE正規化とTMM正規化があって、
求める正規化のファクターが異なる
これらの正規化方法を利用してるのがDESeq/DESeq2やedgeRで、
Rのライブラリーとして配布されている
DESeq/DESeq2はRLE正規化を使う
RLE正規化
RLE 正規化 | DESeq/DESeq2 に実装されている RNA-Seq カウントデータの正規化法
edgeRはTMM正規化を使う
TMM正規化
TMM 正規化 | edgeR で発現変動遺伝子を検出する際に利用する RNA-Seq データの正規化法
DESeq2を使った正規化でサンプルの処理をしている
サルマップ2018 (3) DESeq2による標準化と可視化まで
サルマップ2018 (3) DESeq2による標準化と可視化まで - ノンコーディングRNAネオタクソノミ
こっちはedgeR
edgeR - macでインフォマティクス
28 April 2019追記
edgeR: リードカウントから発現変動遺伝子を検出 - Heavy Watal
こちらにあったがedgeRのUser's Guideが詳しい
まだ読んでる途中だがCase Studiesもある
library(edgeR) edgeRUsersGuide(view=TRUE)
でpdfを表示できる
なおedgeR、DESeq2ともにアップデートがあったようだ
それについてはこの記事の最後に追記した
追記ここまで
edgeRとDESeq2はbioconductorを使ってインストールする
Bioconductor - Home
パッケージマネージャーのBiocManagerをインストールしてから
ライブラリをインストールする
RはwindowsのRGuiを使っていて
versionは3.5.2
BiocManagerのインストール
Bioconductor - Install
edgeRのインストール
Bioconductor - edgeR
if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("edgeR", version = "3.8")
DESeq2のインストール
Bioconductor - DESeq2
if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("DESeq2", version = "3.8")
とりあえずライブラリのインストールまで済んだ
28 April 2019追記、その2
edgeR、DESeq2ともにアップデートがあったようだ
インストールのコマンド
if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("edgeR", version = "3.8")
を再実行するといくつかのパッケージがアップデートされた
それに伴いRのパッケージも手動でアップデートする必要があった
例えば
library(edgeR)
でlibraryを読み込ませたときに
足りないパッケージが表示される
(Rccpだったかな。。。)
RGuiの場合はツールバーから
[パッケージ]->[パッケージのインストール]を選択
先にCRANのミラーサイトを選択する
次にパッケージを選んでインストールする
コマンドラインからだと
install.packages("Rccp", dependencies = TRUE)
でインストールできる
このときCRANのミラーサイトが選ばれていなければ
選択するウィンドウが表示される
追記ここまで