Trinity で複数のRNA-seqのデータをまとめてアセンブル + 出力データの見方

Trinity

最近更新を続けているEnTAPでde novo assemble するRNA-seqデータにアノテーションをつけるプロジェクトの下準備編。 今回はTrinityでde novo アセンブルを行う。 2020/07/09 追記: 出力結果の見方を追記 目的と実行環境 複数のRNA-seqデータをマッピ…

Continue reading

マクロジェンにRNA-seqを委託した話とアダプター配列除去方法

Rna Seq アダプター配列

2022/06/02 Trimmomaticの記述を削除、代わりにfastpを追加。 今回はマクロジェンに委託したRNA-seqについての話。弊ラボではそこにRNA-seqを委託しているので、ラボメンに向けての備忘録も兼ねて。 シーケンスの状態 弊研究室ではRNAシーケンスをマクロジェンに委託してい…

Continue reading

EnTAPでde novo アセンブルした非モデル生物のRNA-seqデータにアノテーション – インストールとデータベース構築

Entap Install

今回は実践編。実際にデータを使ってやってみる。 EnTAP自体については前回の記事を参照して欲しい。 2020/07/20: 公式ドキュメントのリンクが変更されていたので貼り直した 動作環境 Ubuntu 20.04 LTS Ryzen9 3900X (12コア24スレッド) RAM 64GB スト…

Continue reading

ENTAP: 非モデル生物のトランスクリプトームからアノテーション情報を追加する

2469842 S

トランスクリプトーム、とりわけRNA-seqはその組織で発現している遺伝子を定量したり、同定したり、あるいは何らかの条件によって発現量が変化するのを検出したりするのに便利な技術である。 最近は真核生物のゲノムが多く読まれるようになり、利用できるリソースは年々増えてきている。しかし、変わった生物を研究…

Continue reading

DESeq2のインストール

Image 11

まっさらな状態のRにDESeq2をインストールする方法を書き留めておく。 環境はWindows10, R4.0.0, RSudio最新版 まず大原則として、RStudioを管理者権限で実行しなければ書き込み権限の都合上インストールがうまくいかなかった。おそらくインストール先を変えればいいのかもしれな…

Continue reading

NCBI Gene の検索結果から一括で配列取得する方法 – Anaconda環境の導入・NCBI Geneの使い方から取得まで

Image 5

現在在宅で研究をせざるを得ない状況下からか、このサイトのアクセス数が伸びている。 これを期にDRY解析を始めようと思っている人は、配列を自分で持っておらず、公開データベースを用いることが多くなると思うが、いちいち手動でFASTAファイルをダウンロードする方法はいささか効率が悪い。そこで今回は著者が開…

Continue reading

RNA-seqデータをSTARでゲノムデータにマッピングする

Star

RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール…

Continue reading

脊椎動物ゲノムプロジェクト(Vertebrate Genome Project)について

Vgp

最近いくらゲノムを読む価格が下がったとはいえ、マニアックすぎるような生物(前に紹介したアシナシイモリのゲノムのように)が大量にNCBIやEnsembleに登録されるようになってきた。アミメウナギまで登録されており、誰がやってるんだと不思議に思っていた。 わーいやったぜ みたいなノリで使って、論文執筆…

Continue reading

NCBI GeneIDからFASTAを一括自動ダウンロードするツールとNCBIのAPIについて

Ncbi Geneid Fasta

NCBI、よく使うのだがIDの重複がデータベース間で存在していたり、そもそもGeneIDを用いたデータベースをまたいだ検索ができないためストレスフルだった。数個ならいいのだが、今回は数十個あってさすがに1つ1つポチポチ手作業でやるのはバカのやることなのでツールを作ることにした。 NCBI Geneの…

Continue reading