DESeq2のインストール

まっさらな状態のRにDESeq2をインストールする方法を書き留めておく。 環境はWindows10, R4.0.0, RSudio最新版 まず大原則として、RStudioを管理者権限で実行しなければ書き込み権限の都合上インストールがうまくいかなかった。おそらくインストール先を変えればいいのかもしれな…

Continue reading

NCBI Gene の検索結果から一括で配列取得する方法 – Anaconda環境の導入・NCBI Geneの使い方から取得まで

現在在宅で研究をせざるを得ない状況下からか、このサイトのアクセス数が伸びている。 これを期にDRY解析を始めようと思っている人は、配列を自分で持っておらず、公開データベースを用いることが多くなると思うが、いちいち手動でFASTAファイルをダウンロードする方法はいささか効率が悪い。そこで今回は著者が開…

Continue reading

RNA-seqデータをSTARでゲノムデータにマッピングする

RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール…

Continue reading

脊椎動物ゲノムプロジェクト(Vertebrate Genome Project)について

最近いくらゲノムを読む価格が下がったとはいえ、マニアックすぎるような生物(前に紹介したアシナシイモリのゲノムのように)が大量にNCBIやEnsembleに登録されるようになってきた。アミメウナギまで登録されており、誰がやってるんだと不思議に思っていた。 わーいやったぜ みたいなノリで使って、論文執筆…

Continue reading

NCBI GeneIDからFASTAを一括自動ダウンロードするツールとNCBIのAPIについて

NCBI、よく使うのだがIDの重複がデータベース間で存在していたり、そもそもGeneIDを用いたデータベースをまたいだ検索ができないためストレスフルだった。数個ならいいのだが、今回は数十個あってさすがに1つ1つポチポチ手作業でやるのはバカのやることなのでツールを作ることにした。 NCBI Geneの…

Continue reading

RNA-seqのマッピングツールはSTARかHISAT2か

私はRNA-seqのリードのマッピングにSTARを使用しているのだが、ラボの私以外のメンバーはHISAT2を使用している。なんかHISAT2を使用している先輩の結果が「マッピング率が低い」という話だったので実際どの程度違いものなのか気になり、今回調べてまとめることとした。 RNA-seqのマッピング…

Continue reading

【FATE】エキソン-イントロン構造を考慮してゲノムデータに対して配列類似性検索を行う

※本記事はバイオインフォマティクス Advent Calendar 2019の1日目の記事です。何も考えず一番乗り~ってしてしまいましたがプログレス発表や期末レポートの締め切り等が重なって、非常に多忙な中書いた記事なので後日加筆・修正が入るかもしれません 2020/01/03 製作者ご本人からの解説…

Continue reading

PRINSEQ++(plusplus)でRNA-seqのRAWデータのQC(クォリティコントロール)をする

これまでの記事ではfastq-dumpを用いてNCBI上からRNA-seqのデータをダウンロードするなどの「データの入手」に焦点を当ててきた。 参考: SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~ 今回の記事ではそれら、もしくは自分がRNA-seqに解析委託…

Continue reading

SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~

前回のSRA toolkitの記事から結局一年近くが経ってしまった……実際にRNA-seq のデータ解析を始めようと思うのでこの際自分の備忘録および後輩たちへのドキュメントとして今回書き留めていこうと思う。 SRAファイルの中身を見る 結局今現在、SRAファイルはNCBIから直接ダウンロードは出来な…

Continue reading