脊椎動物最大ゲノムのハイギョのRNA-seq解析にはどの程度のスペックのパソコンが必要か?

タイトルの通り。これからハイギョのRNA-seq解析などをしたいという稀有な研究者に向けたメモ。 BLAST 正直BLASTするだけならそこまでスペックはいらない。他のゲノムと比べると時間がかかるが、数コアでも十分可能。 STAR を用いた RNA-seq マッピング RNA-seqでもTrinit…

Continue reading

Featurecountsで”Successfully assigned alignments : 0 (0.0%)”と出る時

FeatureCountsを使ってマッピングしたRNA-seqリードをカウントしようとした時、どうしても全てが「0」カウントで出力されることがあった。 BAMファイルを調べる。 すると、GFFファイルとはぜんぜん異なる染色体の番号が……よくよく元のSTARのパラメータを記したshファイルを読み返すと…

Continue reading

EnTAPでde novoアセンブルしたRNA-seqデータにアノテーション – 実データ編

前回のインストールの記事からめちゃくちゃ時間が経ってしまった。サクッと続きとして実データでの稼働方法を記しておく。 このドキュメントをベースに。 Trinityでde novo assemble Trinityで最初に自分のRNA-seqデータをアセンブルしておく。Trinity以外でも別に問題はな…

Continue reading

FeatureCountsでマッピングしたペアエンドデータのカウントを行う

2021/05/25 追記: Ubuntuでのインストール方法を更新 前回の話とのつながりとしては、STARでRNA-seqのリードをリファレンスゲノムにマッピングしたという前提である。 さて、このマッピングしただけのデータ(SAMファイル)では統計的な解析に向かないという問題点がある。もちろん、こ…

Continue reading

Trinity で複数のRNA-seqのデータをまとめてアセンブル + 出力データの見方

最近更新を続けているEnTAPでde novo assemble するRNA-seqデータにアノテーションをつけるプロジェクトの下準備編。 今回はTrinityでde novo アセンブルを行う。 2020/07/09 追記: 出力結果の見方を追記 目的と実行環境 複数のRNA-seqデータをマッピ…

Continue reading

マクロジェンにRNA-seqを委託した話とアダプター配列除去方法

2022/06/02 Trimmomaticの記述を削除、代わりにfastpを追加。 今回はマクロジェンに委託したRNA-seqについての話。弊ラボではそこにRNA-seqを委託しているので、ラボメンに向けての備忘録も兼ねて。 シーケンスの状態 弊研究室ではRNAシーケンスをマクロジェンに委託してい…

Continue reading

EnTAPでde novo アセンブルした非モデル生物のRNA-seqデータにアノテーション – インストールとデータベース構築

今回は実践編。実際にデータを使ってやってみる。 EnTAP自体については前回の記事を参照して欲しい。 2020/07/20: 公式ドキュメントのリンクが変更されていたので貼り直した 動作環境 Ubuntu 20.04 LTS Ryzen9 3900X (12コア24スレッド) RAM 64GB スト…

Continue reading

ENTAP: 非モデル生物のトランスクリプトームからアノテーション情報を追加する

トランスクリプトーム、とりわけRNA-seqはその組織で発現している遺伝子を定量したり、同定したり、あるいは何らかの条件によって発現量が変化するのを検出したりするのに便利な技術である。 最近は真核生物のゲノムが多く読まれるようになり、利用できるリソースは年々増えてきている。しかし、変わった生物を研究…

Continue reading

DESeq2のインストール

まっさらな状態のRにDESeq2をインストールする方法を書き留めておく。 環境はWindows10, R4.0.0, RSudio最新版 まず大原則として、RStudioを管理者権限で実行しなければ書き込み権限の都合上インストールがうまくいかなかった。おそらくインストール先を変えればいいのかもしれな…

Continue reading