RNA-seqデータをSTARでゲノムデータにマッピングする

RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール…

Continue reading

脊椎動物ゲノムプロジェクト(Vertebrate Genome Project)について

最近いくらゲノムを読む価格が下がったとはいえ、マニアックすぎるような生物(前に紹介したアシナシイモリのゲノムのように)が大量にNCBIやEnsembleに登録されるようになってきた。アミメウナギまで登録されており、誰がやってるんだと不思議に思っていた。 わーいやったぜ みたいなノリで使って、論文執筆…

Continue reading

NCBI GeneIDからFASTAを一括自動ダウンロードするツールとNCBIのAPIについて

NCBI、よく使うのだがIDの重複がデータベース間で存在していたり、そもそもGeneIDを用いたデータベースをまたいだ検索ができないためストレスフルだった。数個ならいいのだが、今回は数十個あってさすがに1つ1つポチポチ手作業でやるのはバカのやることなのでツールを作ることにした。 NCBI Geneの…

Continue reading

RNA-seqのマッピングツールはSTARかHISAT2か

私はRNA-seqのリードのマッピングにSTARを使用しているのだが、ラボの私以外のメンバーはHISAT2を使用している。なんかHISAT2を使用している先輩の結果が「マッピング率が低い」という話だったので実際どの程度違いものなのか気になり、今回調べてまとめることとした。 RNA-seqのマッピング…

Continue reading

【FATE】エキソン-イントロン構造を考慮してゲノムデータに対して配列類似性検索を行う

※本記事はバイオインフォマティクス Advent Calendar 2019の1日目の記事です。何も考えず一番乗り~ってしてしまいましたがプログレス発表や期末レポートの締め切り等が重なって、非常に多忙な中書いた記事なので後日加筆・修正が入るかもしれません 2020/01/03 製作者ご本人からの解説…

Continue reading

PRINSEQ++(plusplus)でRNA-seqのRAWデータのQC(クォリティコントロール)をする

これまでの記事ではfastq-dumpを用いてNCBI上からRNA-seqのデータをダウンロードするなどの「データの入手」に焦点を当ててきた。 参考: SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~ 今回の記事ではそれら、もしくは自分がRNA-seqに解析委託…

Continue reading

SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~

前回のSRA toolkitの記事から結局一年近くが経ってしまった……実際にRNA-seq のデータ解析を始めようと思うのでこの際自分の備忘録および後輩たちへのドキュメントとして今回書き留めていこうと思う。 SRAファイルの中身を見る 結局今現在、SRAファイルはNCBIから直接ダウンロードは出来な…

Continue reading

MAFFT→RAxML→FigTreeで遺伝子の系統樹を作成する – Ubuntu19.04

今回は複数種における複数の遺伝子の塩基配列をアラインメントし,最尤法を用いた系統樹推定を行いたい. タイトルにもある通り,今回はUbuntuを扱って解析を行う.mac信者やWindowsユーザーはお帰り願いたい.他にTOGOTVなど色々解説しているところがあるので. 環境 環境は以下の通り Ryze…

Continue reading

【BLAST】tblastnで Could not calculate ungapped Karlin-Altschul parameters due to an invalid query sequence or its translation. Please verify the query sequence(s) and/or filtering options と出る

アホみたいなミスをして時間を溶かしたので万が一こんなエラーで悩んでいる一のための備忘録 問題点 makeblastdbでデータベースを作成後,クエリーとしてとあるmRNAの配列を用意し,tblastnにかけた. その結果,Could not calculate ungapped Karlin-Alt…

Continue reading