mecobalamin’s diary

人間万事塞翁が馬

RNA-seqその7、TrinityでアセンブルしてBlastにかける

TrinityでシークエンスデータをアセンブルしてBlastにかけるそのためにまずhisat2でゲノムにマッピングしたデータをアセンブルし、 できたfastaファイルをもとにblastのデータベースを作る そしてこのデータベースと目的の遺伝子を 記入したfastaファイルを…

フォーマット変換、GTF -> BED -> BAM

GTFファイルからBAMファイルにフォーマットを変換したいまずフォーマットについて。 GTF/GFF GTFとGFFフォーマット - macでインフォマティクスSAM/BAM BAM – 遺伝子発現解析(マイクロアレイ解析, RNA-seq) SAMフォーマット | SAM ファイルの取り扱い方BED …

ドライブの速度比較

ファイルの書き込みに時間がかかってる 実際にディスクの書き込み速度がどの程度違うか比較した比較したのはPC内蔵のSSD、HDD、USB3.1接続のHDD、USBメモリ、それとRAMディスク計測はCrystal Disk Markを使った USBメモリのみドライブとして認識されていなか…

windows10 homeのwslにdockerをインストールする

使いたいコマンドがDockerで配布されてた 細胞画像のセグメンテーションに使う DeepCell Kiosk: Deploying a Scalable Solution for Biological Image Analysis — DeepCell Kiosk 1.0.0 documentationDockerとはなんぞや。。。 無償の「Docker for Windows」…

Rで折れ線グラフ

Rで時系列データの折れ線グラフを作る グラフを書くことよりも日付の処理が面倒だったのでそのメモ作りたいのは気温と海水温の時系列グラフ 気温と海水温の軸を左右に分けて、日付の軸は共通にする 折れ線グラフの赤が海水温で青が気温を示す気温と海水温の…

JBrowseにplug-inを追加する

JBrowseにpluginを追加するインストール方法はここを参考にした。 How do I install a plugin JBrowse FAQ - GMOD試しにSashimiPlotのプラグインをインストールする まずpluginのダウンロードして展開 ディレクトリの名前をリネームするして JBrowseのディレ…

scriptを止める

Atomが起動しなくなったので 再インストールここからダウンロード Atomインストールしたらそのまま使えた パッケージもインストールされてた 設定ファイルは残っているみたいだ起動しなくなった理由だけど Rのスクリプトをscript pluginで実行したら スペル…

beautiful soupで更新チェック

iPad mini 5が出るような噂 もしかしたらmini 4が安く出るんではないかと 整備品の値段をappleのサイトでいちいち調べてた名前と値段のリストをとってくるスクリプトを書いてみた PythonのBeautiful Soup4をつかうまずiPadの正規整備品のサイトから "refurbi…

apt-getでファイルがダウンロードできない

apt-getでパッケージをインストールしようとしたら ファイルがダウンロードできずにインストール出来なかったので 解決方法のメモ欲しかったのはlibGL.so.1 opencv_createsamplesをインストールして実行したら libGL.so.1がないってエラーが出たパッケージの…

メモ: リードカウントデータの正規化について

featureCountsでリードカウントしたあとに 複数のデータを比較する場合、 カウントの正規化が必要らしいまだ良くわかってないので 参考にしているサイトのリンクを張っておく ペアエンドのサンプルをリードカウントするときのコマンドがあった featureCounts…

hg38のfastaとgtf/gff3

GRCh38とhg38はヒトゲノムのシークエンスデータ ほとんど一緒らしい。 前にも引用させてもらったけどここに説明がある。 GRCh38とhg38の違い(含むミトコンドリア) GRCh38染色体名(ヘッダ行)が長く(gi|568815597|ref|NC_000001.11|)、hg38は簡潔(chr1)。 ヘッ…

bigwigの作成と表示

JBrowseでbamを表示させるとリードがずらーっと並ぶ 実際にいくつあるのかわかりやすくするために ヒストグラムで表示したいbamをbigwig形式にする bam2wigとwigToBigWigを使う ここを参考にした bamからbigWigとWiggle Formatに変換するツール - macでイン…

RNA-seqその6、featureCountsでリードカウント

前回作ったbamファイルを使って発現量を調べる mecobalamin.hatenablog.com使うコマンドはfeatureCountこちらのサイトを参考にした featureCount で bam と gtf からリードカウントを得る | Tips for NGS Data Analysis https://ncrna.jp/blog/item/387-feat…

RNA-seqその5、Hisat2でマッピング

RNAseqの結果をリファレンス配列にマッピングする mecobalamin.hatenablog.comレファレンスデータはヒトのゲノムデータ Human Genome Resources at NCBI - NCBI ここからReference Genome Sequenceをダウンロード28 Feb. 2019追記 ヒトゲノムデータにはデー…

RNA-seqその4、Fastqファイルのマージ

クリーニングしたFastqファイルを一つにまとめる mecobalamin.hatenablog.complinseq-liteで評価の良かったリードだけをマージする ファイル名に"gd"を含むファイルを使うことになる read 1とread 2を区別するマージしたファイルは、マージ前と同じディレク…

RNA-seqその3、trimmomatic

分割したFastqファイルのクリーニングをする mecobalamin.hatenablog.comtrimmomaticについて Trimmomatic | FASTQ クリーニングツールtrimmomaticを実行するとファイルへのアクセスがとても多い windowsのタスクマネージャーを見ると 解析するデータが大き…

JBrowseでbamファイルを表示する

インストールしたJBrowseにゲノムデータを表示させる表示させるのは レファレンスにするヒトのゲノムデータと GRCh38_latest_genomic.fna ref_GRCh38.p12_top_level.gff3HeLaのRNAseqのデータから作ったbamファイル こっちが実験データの代わりになる sort_S…

JBrowseのインストール、三度目の正直

JBrowseのインストールをやりなおした。 変更点はインストール先を変えたこと、 サーバーをpythonのhttp.serverから wslのapache2に変更したことの2点。というのも作ったbamファイルが表示できなくて いろいろ調べていたら公式の説明にこんなのがあった JBro…

Atomでscript

普段使っているエディターはAtom 殆どいじっていないが、 pythonとRを実行できるようにしてある 必要なpackageは scriptとlangage-rpackageをインストールしたら windowsのシステム環境設定で Rscriptのディレクトリにパスを通す \R-3.5.0\binやってたはずだ…

メモ: コマンドのリンク先とWSLのCPU使用率

condaでパッケージをインストールするときの注意点 pythonとパッケージをインストールしたはずなんだけど コマンド実行中にモジュールが見つからないってエラーが出ることがある実際Trinityを使っててnumpyがないってエラーがでた パッケージを入れてあるか…

RNA-seqその2、データのダウンロードと変換

シークエンスのデータの入手方法には 公共のデータベースからシークエンスデータをダウンロードする シークエンスを行う などがある。今回は公共のデータベースのデータを使う 公共データベースによって登録されているファイル形式は異なる NCBIはSRA、DDBJ/…

RNA-seqその1、インストール

wsl上でRNA-seqの解析を行う 手順を学んだのでそのメモメモするのは コマンドのインストール(このページ) RNA-seqその2、データのダウンロードと変換 - mecobalamin’s diary RNA-seqその3、trimmomatic - mecobalamin’s diary RNA-seqその4、Fastqファイ…

JBrowseのインストール 続き

24 February 2019 追記 やり直したので新しい方のリンク mecobalamin.hatenablog.comxlocale.hがなくてJBrowseのインストールで詰まった前回も参照したサイトに方法があった。 xlocale.h not found on Ubuntu while installing · Issue #16 · agracio/electr…

JBrowseのインストール

24 February 2019 追記 やり直したので新しい方のリンク mecobalamin.hatenablog.comゲノムデータをブラウザで表示するツールにJBrowseがある。 JBrowse · A fast, embeddable genome browser built with HTML5 and JavaScript 元論文はこちら JBrowse · A f…

sedの使い方

ファイルサイズが10 MBで中身が10万行を 超えるようなテキストファイルで、 列のラベルによって置換する文字を 変えるシェルスクリプトを書いた例えばn列がhogehogeの場合、m列をaaaからbbbに変えて n列がhugahugaの場合、m列をaaaからcccに変えるような シ…

コードにシンタックスハイライト

コードに色付してPowerPointに貼り付けたい。 リッチテキスト形式であれば シンタックスハイライトをつけたまま 貼り付けられるそうだ。 Keynote(Mac版パワポも)にソースコードを貼る - Qiita普段使っているエディタがAtomなので copy-as-rtfをインストー…

tmuxでターミナルを分割する

ターミナルをいくつか立ち上げてると タブもいいんだけど画面が分割できたらべんりだなーって 思っていたらtmuxってのがあった ターミナルマルチプレクサ tmux をカスタマイズする - Qiita tmuxのすすめ - catatsuy's Blog ペイン間の移動もキーボードからな…

VcXsrvの自動起動

windowsを起動するときにVcXsrvも起動したい実行ファイルにオプションを付けたショートカットを スタートアップフォルダに保存しとけばいいっぽいんだけど windows起動のたびに設定画面が出てきて若干めんどいXLaunch - Finish configuration コンフィグファ…

vimのインストール、再び

vimでクリップボードを使えるように インストールを再挑戦 WindowsでLinux commandを動かす - mecobalamin’s diary前の記事といろいろかぶるホームにtmpディレクトリを作ってそこに gitからソースコードをダウンロード $ mkdir ~/tmp $ cd ~/tmp $ git clone…

WSLでssh

Windows Subsystem for Linux (WSL)から sshを使ってリモートサーバーにログインするまず秘密鍵を作ってリモートサーバーに置く $ ssh-keygen -b 2048 $ ssh-copy-id hogehoge@fugafuga.jp ログインは $ ssh hogehoge@fugafuga.jp なんだけどlocaleのエラー…