フリーソフトMEGAでコロナウイルスの配列解析をしよう – 暇を持て余した情報・生物系学生へ

【注意】この記事は医学的知見を与えるものではありません。また本記事に従って得たデータに関して当サイトは一切の責任を負いません。 全世界でコロナウイルスによるパンデミックが起こり、2020/03/29 現在ではイタリアで死者1万人超え、全世界でも3万人を超えるという大事態に発展している。 私が住む東京…

Continue reading

RaNA-seq – Salmonを使用した高速RNA-seq解析Webサービス

なんかラボのメーリングリストに有用な新しい論文とか流したりしているが、そもそもボス以外興味を示さない上、技術の話になると誰も反応がなくなることからこれからはこっちに書き留めておくこととする。 今回紹介するのはRaNA-seqというWebサービスだ。 Carlos Prieto, David Barr…

Continue reading

RNA-seqデータをSTARでゲノムデータにマッピングする

RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール…

Continue reading

脊椎動物ゲノムプロジェクト(Vertebrate Genome Project)について

最近いくらゲノムを読む価格が下がったとはいえ、マニアックすぎるような生物(前に紹介したアシナシイモリのゲノムのように)が大量にNCBIやEnsembleに登録されるようになってきた。アミメウナギまで登録されており、誰がやってるんだと不思議に思っていた。 わーいやったぜ みたいなノリで使って、論文執筆…

Continue reading

NCBI GeneIDからFASTAを一括自動ダウンロードするツールとNCBIのAPIについて

NCBI、よく使うのだがIDの重複がデータベース間で存在していたり、そもそもGeneIDを用いたデータベースをまたいだ検索ができないためストレスフルだった。数個ならいいのだが、今回は数十個あってさすがに1つ1つポチポチ手作業でやるのはバカのやることなのでツールを作ることにした。 NCBI Geneの…

Continue reading

RNA-seqのマッピングツールはSTARかHISAT2か

私はRNA-seqのリードのマッピングにSTARを使用しているのだが、ラボの私以外のメンバーはHISAT2を使用している。なんかHISAT2を使用している先輩の結果が「マッピング率が低い」という話だったので実際どの程度違いものなのか気になり、今回調べてまとめることとした。 RNA-seqのマッピング…

Continue reading

【FATE】エキソン-イントロン構造を考慮してゲノムデータに対して配列類似性検索を行う

※本記事はバイオインフォマティクス Advent Calendar 2019の1日目の記事です。何も考えず一番乗り~ってしてしまいましたがプログレス発表や期末レポートの締め切り等が重なって、非常に多忙な中書いた記事なので後日加筆・修正が入るかもしれません 2020/01/03 製作者ご本人からの解説…

Continue reading

PRINSEQ++(plusplus)でRNA-seqのRAWデータのQC(クォリティコントロール)をする

これまでの記事ではfastq-dumpを用いてNCBI上からRNA-seqのデータをダウンロードするなどの「データの入手」に焦点を当ててきた。 参考: SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~ 今回の記事ではそれら、もしくは自分がRNA-seqに解析委託…

Continue reading

SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~

前回のSRA toolkitの記事から結局一年近くが経ってしまった……実際にRNA-seq のデータ解析を始めようと思うのでこの際自分の備忘録および後輩たちへのドキュメントとして今回書き留めていこうと思う。 SRAファイルの中身を見る 結局今現在、SRAファイルはNCBIから直接ダウンロードは出来な…

Continue reading