EnTAPでde novoアセンブルしたRNA-seqデータにアノテーション – 実データ編 Kim 2021年3月1日 2021年3月1日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq, de novo アセンブリ, EnTAP 前回のインストールの記事からめちゃくちゃ時間が経ってしまった。サクッと続きとして実データでの稼働方法を記しておく。 このドキュメントをベースに。 Trinityでde novo assemble Trinityで最初に自分のRNA-seqデータをアセンブルしておく。Trinity以外でも別に問題はな… Continue reading
FeatureCountsでマッピングしたペアエンドデータのカウントを行う Kim 2020年12月26日 2020年12月26日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq 前回の話とのつながりとしては、STARでRNA-seqのリードをリファレンスゲノムにマッピングしたという前提である。 さて、このマッピングしただけのデータ(SAMファイル)では統計的な解析に向かないという問題点がある。もちろん、これをIGVなどのゲノムブラウザに読み込ませてどこにリードが貼り付いてい… Continue reading
Trinity で複数のRNA-seqのデータをまとめてアセンブル + 出力データの見方 Kim 2020年7月6日 2020年7月9日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq, de novo アセンブリ, Trinity 最近更新を続けているEnTAPでde novo assemble するRNA-seqデータにアノテーションをつけるプロジェクトの下準備編。 今回はTrinityでde novo アセンブルを行う。 2020/07/09 追記: 出力結果の見方を追記 目的と実行環境 複数のRNA-seqデータをマッピ… Continue reading
マクロジェンにRNA-seqを委託した話とアダプター配列除去方法 Kim 2020年7月2日 2020年7月2日RNA-seq, バイオインフォマティクス RNA-seq, クォリティコントロール 今回はマクロジェンに委託したRNA-seqについての話。弊ラボではそこにRNA-seqを委託しているので、ラボメンに向けての備忘録も兼ねて。 シーケンスの状態 弊研究室ではRNAシーケンスをマクロジェンに委託している。シーケンサはNovaSeq6000で100bpもしくは150bpで読んでいる。相乗… Continue reading
EnTAPでde novo アセンブルした非モデル生物のRNA-seqデータにアノテーション – インストールとデータベース構築 Kim 2020年6月28日 2021年3月1日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq, de novo アセンブリ, EnTAP 今回は実践編。実際にデータを使ってやってみる。 EnTAP自体については前回の記事を参照して欲しい。 2020/07/20: 公式ドキュメントのリンクが変更されていたので貼り直した 動作環境 Ubuntu 20.04 LTS Ryzen9 3900X (12コア24スレッド) RAM 64GB スト… Continue reading
ENTAP: 非モデル生物のトランスクリプトームからアノテーション情報を追加する Kim 2020年6月24日 2020年6月28日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq, de novo アセンブリ, EnTAP トランスクリプトーム、とりわけRNA-seqはその組織で発現している遺伝子を定量したり、同定したり、あるいは何らかの条件によって発現量が変化するのを検出したりするのに便利な技術である。 最近は真核生物のゲノムが多く読まれるようになり、利用できるリソースは年々増えてきている。しかし、変わった生物を研究… Continue reading
DESeq2のインストール Kim 2020年5月27日 2020年6月27日RNA-seq, R, バイオインフォマティクス RNA-seq, R まっさらな状態のRにDESeq2をインストールする方法を書き留めておく。 環境はWindows10, R4.0.0, RSudio最新版 まず大原則として、RStudioを管理者権限で実行しなければ書き込み権限の都合上インストールがうまくいかなかった。おそらくインストール先を変えればいいのかもしれな… Continue reading
RaNA-seq – Salmonを使用した高速RNA-seq解析Webサービス Kim 2020年3月22日 2020年12月26日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq 今回紹介するのはRaNA-seqというWebサービスだ。 Carlos Prieto, David Barrios, RaNA-Seq: interactive RNA-Seq analysis from FASTQ files to functional analysis, Bioinf… Continue reading
RNA-seqデータをSTARでゲノムデータにマッピングする Kim 2020年2月26日 2020年4月30日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq, マッピング RNA-seqのマッピングにはいろいろなものが開発されている。中でも有名なものがBowtie系、HISAT2、そしてSTARである。 現在主流なのはHISAT2とSTARであり、性能としてはSTARのほうが上であるが要求マシンスペックはSTARのほうが高い。 参考: RNA-seqのマッピングツール… Continue reading
RNA-seqのマッピングツールはSTARかHISAT2か Kim 2019年12月18日 2020年2月26日RNA-seq, バイオインフォマティクス バイオインフォマティクス, RNA-seq, STAR, HISAT2, マッピング 私はRNA-seqのリードのマッピングにSTARを使用しているのだが、ラボの私以外のメンバーはHISAT2を使用している。なんかHISAT2を使用している先輩の結果が「マッピング率が低い」という話だったので実際どの程度違いものなのか気になり、今回調べてまとめることとした。 RNA-seqのマッピング… Continue reading