EnTAPでde novo アセンブルした非モデル生物のRNA-seqデータにアノテーション – インストールとデータベース構築

Entap install

今回は実践編。実際にデータを使ってやってみる。 EnTAP自体については前回の記事を参照して欲しい。 2020/07/20: 公式ドキュメントのリンクが変更されていたので貼り直した 動作環境 Ubuntu 20.04 LTS Ryzen9 3900X (12コア24スレッド) RAM 64GB スト…

Continue reading

ENTAP: 非モデル生物のトランスクリプトームからアノテーション情報を追加する

2469842 s

トランスクリプトーム、とりわけRNA-seqはその組織で発現している遺伝子を定量したり、同定したり、あるいは何らかの条件によって発現量が変化するのを検出したりするのに便利な技術である。 最近は真核生物のゲノムが多く読まれるようになり、利用できるリソースは年々増えてきている。しかし、変わった生物を研究…

Continue reading

DESeq2のインストール

Image 11

まっさらな状態のRにDESeq2をインストールする方法を書き留めておく。 環境はWindows10, R4.0.0, RSudio最新版 まず大原則として、RStudioを管理者権限で実行しなければ書き込み権限の都合上インストールがうまくいかなかった。おそらくインストール先を変えればいいのかもしれな…

Continue reading

RNA-seqデータをSTARでゲノムデータにマッピングする

Star

RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール…

Continue reading

RNA-seqのマッピングツールはSTARかHISAT2か

Stastarvshisat2 eye

私はRNA-seqのリードのマッピングにSTARを使用しているのだが、ラボの私以外のメンバーはHISAT2を使用している。なんかHISAT2を使用している先輩の結果が「マッピング率が低い」という話だったので実際どの程度違いものなのか気になり、今回調べてまとめることとした。 RNA-seqのマッピング…

Continue reading

PRINSEQ++(plusplus)でRNA-seqのRAWデータのQC(クォリティコントロール)をする

Prinseq

これまでの記事ではfastq-dumpを用いてNCBI上からRNA-seqのデータをダウンロードするなどの「データの入手」に焦点を当ててきた。 参考: SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~ 今回の記事ではそれら、もしくは自分がRNA-seqに解析委託…

Continue reading