mecobalamin’s diary

人間万事塞翁が馬

https://help.hatenablog.com/entry/developer-option

RNA-seqその9、DESeq2を使った正規化

write_adv(adv_url_008); 以前edgeRでリードカウントの正規化をした 同じ結果をDESeq2を使って正規化してみる 正規化の方法が違うらしいDESeq2のマニュアル これは読むべき Analyzing RNA-seq data with DESeq2マニュアルはDESeq2をインストール後に browseV…

メモ: Dockerを使ってみる

dockerをwslで動くようにインストールした mecobalamin.hatenablog.com とりあえずhello-worldは動いたが、目的のコンテナが動いてくれないもうちょっと情報集め試しに他のコンテナが動くかどうかを調べたいDocker Hubってのがあった https://hub.docker.com…

python3.xと2.xを切り替える

condaでインストールするパッケージで、 python2.xで動くのがある 仕組みがよくわかってないけどこのパッケージを condaのコマンドでインストールすると pythonを3.xから2.xに変えてしまうっぽいなので2.x系で動くパッケージはpython2.xが動く環境を作成して…

OpenCVで画像認識

pythonとOpenCVを使って画像認識をしたい対象は猫ではないけど やりたいのはこんな感じのこと openCVで物体認識 by traincascade - QiitaOpenCVってなんだ OpenCV - Wikipediaとりあえず必要なプログラム・コマンドのインストール画像の下処理はImageJで行う…

fioその2、ストレージのベンチマーク測定

前回の続き mecobalamin.hatenablog.com今回は測定結果 内蔵SSD、SATA接続 $ bash ./fio-cdm_190518.sh /mnt/c/fio_tmp fio-3.1 /mnt/c/fio_tmp | | Read(MB/s)|Write(MB/s)| |------|-----------|-----------| | Seq | 2339.000| 1743.000| | 512K | 2223.0…

fioその1、ストレージのベンチマーク測定

以前windowsのCrystalDiskMarkを使って ストレージのベンチマークを測定した今回はwslのコマンドのfioを使って測定する以前書いた記事 mecobalamin.hatenablog.com fioのについてもちょっと書いてある mecobalamin.hatenablog.comfioのバージョンは3.1こちら…

メモ: ヒアドキュメント

ストレージのベンチマークを測定するコマンドにfioがある 調べてみると実行時のオプションとか 結果の出力結果とか、とても情報が多い 出力結果をうまく処理してくれるラッパーを作ってくれてる人がいるのだが、 シェルスクリプトで見たことない書き方があっ…

今度はshell scriptで

検索でこのページが引っかかっているようですが 消しちゃったので別の記事を載せます以前pythonとRでやったことをShell scriptでも書いてみた mecobalamin.hatenablog.com mecobalamin.hatenablog.com書いたスクリプトはこれ #!/bin/bash ppap_array=() ppap…

RNA-seqその8、edgeRを使ったTMM正規化

write_adv(adv_url_005); 21 June 2019追記 文章を少し修正した 追記ここまでfeatrureCountの結果をedgeRを使って正規化するこのtutorialのpdfファイルと以下のリンク先を参考にしたStatistical analysis of RNA-Seq data http://www.nathalievialaneix.eu/d…

RNA-seqその7、TrinityでアセンブルしてBlastにかける

TrinityでシークエンスデータをアセンブルしてBlastにかけるそのためにまずhisat2でゲノムにマッピングしたデータをアセンブルし、 できたfastaファイルをもとにblastのデータベースを作る そしてこのデータベースと目的の遺伝子を 記入したfastaファイルを…

フォーマット変換、GTF -> BED -> BAM

GTFファイルからBAMファイルにフォーマットを変換したいまずフォーマットについて。 GTF/GFF GTFとGFFフォーマット - macでインフォマティクスSAM/BAM BAM – 遺伝子発現解析(マイクロアレイ解析, RNA-seq) https://bi.biopapyrus.jp/rnaseq/mapping/sam.ht…

ドライブの速度比較

ファイルの書き込みに時間がかかってる 実際にディスクの書き込み速度がどの程度違うか比較した比較したのはPC内蔵のSSD、HDD、USB3.1接続のHDD、USBメモリ、それとRAMディスク計測はCrystal Disk Markを使った USBメモリのみドライブとして認識されていなか…

windows10 homeのwslにdockerをインストールする

5 October 2020 追記 誤字の修正 追記ここまで1 June 2019追記 インストールをやり直したらうまくいかない操作があったので書き直した 追記ここまで使いたいコマンドがDockerで配布されてたのでインストールしたいDockerとはなんぞや。。。 無償の「Docker f…

Rで折れ線グラフ

Rで時系列データの折れ線グラフを作る グラフを書くことよりも日付の処理が面倒だったのでそのメモ write_adv(adv_url_003); 12 December 2020 追記 データは異なるがPythonでも書いてみた mecobalamin.hatenablog.com 追記ここまで 作りたいのは気温と海水…

JBrowseにplug-inを追加する

JBrowseにpluginを追加するインストール方法はここを参考にした。 How do I install a plugin JBrowse FAQ - GMOD試しにSashimiPlotのプラグインをインストールする まずpluginのダウンロードして展開 ディレクトリの名前をリネームするして JBrowseのディレ…

scriptを止める

Atomが起動しなくなったので 再インストールここからダウンロード Atomインストールしたらそのまま使えた パッケージもインストールされてた 設定ファイルは残っているみたいだ起動しなくなった理由だけど Rのスクリプトをscript pluginで実行したら スペル…

beautiful soupで更新チェック

iPad mini 5が出るような噂 もしかしたらmini 4が安く出るんではないかと 整備品の値段をappleのサイトでいちいち調べてた名前と値段のリストをとってくるスクリプトを書いてみた PythonのBeautiful Soup4をつかうスクレイピングについて参考にしたのはこの…

apt-getでファイルがダウンロードできない

ライブラリを追加したくてapt-getを使ったら ファイルがダウンロードできずにエラーが出たので 解決方法のメモしとく欲しかったのはlibGL.so.1opencv_createsamplesをインストールして実行したら libGL.so.1がないってエラーが出たパッケージの探し方もよく…

メモ: リードカウントデータの正規化について

17 May 2019追記 メモした内容で実際に正規化してみた mecobalamin.hatenablog.com mecobalamin.hatenablog.com追記ここまで write_adv(adv_url_003); featureCountsでリードカウントしたあとに 複数のデータを比較する場合、 カウントの正規化が必要らしい…

hg38のfastaとgtf/gff3

GRCh38とhg38はヒトゲノムのシークエンスデータ ほとんど一緒らしい。 前にも引用させてもらったけどここに説明がある。 GRCh38とhg38の違い(含むミトコンドリア) GRCh38染色体名(ヘッダ行)が長く(gi|568815597|ref|NC_000001.11|)、hg38は簡潔(chr1)。 ヘッ…

bigwigの作成と表示

JBrowseでbamを表示させるとリードがずらーっと並ぶ 実際にいくつあるのかわかりやすくするために ヒストグラムで表示したいbamをbigwig形式にする bam2wigとwigToBigWigを使う ここを参考にした bamからbigWigとWiggle Formatに変換するツール - macでイン…

RNA-seqその6、featureCountsでリードカウント

前回作ったbamファイルを使って発現量を調べる mecobalamin.hatenablog.com使うコマンドはfeatureCountこちらのサイトを参考にした featureCount で bam と gtf からリードカウントを得る | Tips for NGS Data Analysis https://ncrna.jp/blog/item/387-feat…

RNA-seqその5、Hisat2でマッピング

RNAseqの結果をリファレンス配列にマッピングする mecobalamin.hatenablog.comレファレンスデータはヒトのゲノムデータ Human Genome Resources at NCBI - NCBI ここからReference Genome Sequenceをダウンロード28 Feb. 2019追記 ヒトゲノムデータにはデー…

RNA-seqその4、Fastqファイルのマージ

クリーニングしたFastqファイルを一つにまとめる mecobalamin.hatenablog.complinseq-liteで評価の良かったリードだけをマージする ファイル名に"gd"を含むファイルを使うことになる read 1とread 2を区別するマージしたファイルは、マージ前と同じディレク…

RNA-seqその3、trimmomatic

分割したFastqファイルのクリーニングをする mecobalamin.hatenablog.comtrimmomaticについて Trimmomatic | FASTQ クリーニングツールtrimmomaticを実行するとファイルへのアクセスがとても多い windowsのタスクマネージャーを見ると 解析するデータが大き…

JBrowseでbamファイルを表示する

インストールしたJBrowseにゲノムデータを表示させる表示させるのは レファレンスにするヒトのゲノムデータと GRCh38_latest_genomic.fna ref_GRCh38.p12_top_level.gff3HeLaのRNAseqのデータから作ったbamファイル こっちが実験データの代わりになる sort_S…

JBrowseのインストール、三度目の正直

12 October 2020 追記 mecobalamin.hatenablog.com JBrowseをdockerで動くようにした最低限必要なコマンドやライブラリをインストールした 以下の記事を参照する mecobalamin.hatenablog.comdockerが使えていればubuntuのコンテナに JBrowseをインストールす…

Atomでscript

普段使っているエディターはAtom 殆どいじっていないが、 pythonとRを実行できるようにしてある 必要なpackageは scriptとlanguage-rpackageをインストールしたら windowsのシステム環境変数で Rscriptのディレクトリにパスを通す \R-3.5.0\binwindowsの設定…

メモ: コマンドのリンク先とWSLのCPU使用率

condaでパッケージをインストールするときの注意点 pythonとパッケージをインストールしたはずなんだけど コマンド実行中にモジュールが見つからないってエラーが出ることがある実際Trinityを使っててnumpyがないってエラーがでた パッケージを入れてあるか…

RNA-seqその2、データのダウンロードと変換

シークエンスのデータの入手方法には 公共のデータベースからシークエンスデータをダウンロードする シークエンスを行う などがある。今回は公共のデータベースのデータを使う 公共データベースによって登録されているファイル形式は異なる NCBIはSRA、DDBJ/…