EnTAPでde novo アセンブルした非モデル生物のRNA-seqデータにアノテーション – インストールとデータベース構築

今回は実践編。実際にデータを使ってやってみる。 EnTAP自体については前回の記事を参照して欲しい。 2020/07/20: 公式ドキュメントのリンクが変更されていたので貼り直した 動作環境 Ubuntu 20.04 LTS Ryzen9 3900X (12コア24スレッド) RAM 64GB スト…

Continue reading

ENTAP: 非モデル生物のトランスクリプトームからアノテーション情報を追加する

トランスクリプトーム、とりわけRNA-seqはその組織で発現している遺伝子を定量したり、同定したり、あるいは何らかの条件によって発現量が変化するのを検出したりするのに便利な技術である。 最近は真核生物のゲノムが多く読まれるようになり、利用できるリソースは年々増えてきている。しかし、変わった生物を研究…

Continue reading

Springer Nature が無料公開中 – バイオインフォ・進化生物学の教科書厳選3冊!

かのぼったくり出版社がこのご時世を鑑みて一部の教科書を無料公開している。 すべての本の目録についてはここからダウンロードできる バイオインフォ・進化生物学の教科書3選! バイオインフォ・進化生物学の教科書厳選3選! とかいいながら実際には3冊しか無いのでそれだけしか紹介できないのである。 それはとも…

Continue reading

NCBI Gene の検索結果から一括で配列取得する方法 – Anaconda環境の導入・NCBI Geneの使い方から取得まで

現在在宅で研究をせざるを得ない状況下からか、このサイトのアクセス数が伸びている。 これを期にDRY解析を始めようと思っている人は、配列を自分で持っておらず、公開データベースを用いることが多くなると思うが、いちいち手動でFASTAファイルをダウンロードする方法はいささか効率が悪い。そこで今回は著者が開…

Continue reading

RNA-seqデータをSTARでゲノムデータにマッピングする

RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール…

Continue reading

脊椎動物ゲノムプロジェクト(Vertebrate Genome Project)について

最近いくらゲノムを読む価格が下がったとはいえ、マニアックすぎるような生物(前に紹介したアシナシイモリのゲノムのように)が大量にNCBIやEnsembleに登録されるようになってきた。アミメウナギまで登録されており、誰がやってるんだと不思議に思っていた。 わーいやったぜ みたいなノリで使って、論文執筆…

Continue reading

NCBI GeneIDからFASTAを一括自動ダウンロードするツールとNCBIのAPIについて

NCBI、よく使うのだがIDの重複がデータベース間で存在していたり、そもそもGeneIDを用いたデータベースをまたいだ検索ができないためストレスフルだった。数個ならいいのだが、今回は数十個あってさすがに1つ1つポチポチ手作業でやるのはバカのやることなのでツールを作ることにした。 NCBI Geneの…

Continue reading

RNA-seqのマッピングツールはSTARかHISAT2か

私はRNA-seqのリードのマッピングにSTARを使用しているのだが、ラボの私以外のメンバーはHISAT2を使用している。なんかHISAT2を使用している先輩の結果が「マッピング率が低い」という話だったので実際どの程度違いものなのか気になり、今回調べてまとめることとした。 RNA-seqのマッピング…

Continue reading

【FATE】エキソン-イントロン構造を考慮してゲノムデータに対して配列類似性検索を行う

※本記事はバイオインフォマティクス Advent Calendar 2019の1日目の記事です。何も考えず一番乗り~ってしてしまいましたがプログレス発表や期末レポートの締め切り等が重なって、非常に多忙な中書いた記事なので後日加筆・修正が入るかもしれません 2020/01/03 製作者ご本人からの解説…

Continue reading