PRINSEQ++(plusplus)でRNA-seqのRAWデータのQC(クォリティコントロール)をする

これまでの記事ではfastq-dumpを用いてNCBI上からRNA-seqのデータをダウンロードするなどの「データの入手」に焦点を当ててきた。 参考: SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~ 今回の記事ではそれら、もしくは自分がRNA-seqに解析委託…

Continue reading

SRA Toolkitの使い方 ~fastq-dumpでSRAファイルをダウンロード~

前回のSRA toolkitの記事から結局一年近くが経ってしまった……実際にRNA-seq のデータ解析を始めようと思うのでこの際自分の備忘録および後輩たちへのドキュメントとして今回書き留めていこうと思う。 SRAファイルの中身を見る 結局今現在、SRAファイルはNCBIから直接ダウンロードは出来な…

Continue reading

MAFFT→RAxML→FigTreeで遺伝子の系統樹を作成する – Ubuntu19.04

今回は複数種における複数の遺伝子の塩基配列をアラインメントし,最尤法を用いた系統樹推定を行いたい. タイトルにもある通り,今回はUbuntuを扱って解析を行う.mac等は他にTOGOTVなど色々解説しているところがあるので. 環境 環境は以下の通り Ryzen5 3400G (Ryzen9 3900…

Continue reading

【BLAST】tblastnで Could not calculate ungapped Karlin-Altschul parameters due to an invalid query sequence or its translation. Please verify the query sequence(s) and/or filtering options と出る

アホみたいなミスをして時間を溶かしたので万が一こんなエラーで悩んでいる一のための備忘録 問題点 makeblastdbでデータベースを作成後,クエリーとしてとあるmRNAの配列を用意し,tblastnにかけた. その結果,Could not calculate ungapped Karlin-Alt…

Continue reading

生命科学における主な配列データベース

2018/10/13 時点でのまとめ.先日GEAが登録開始したように追加があるので気が向いたら随時更新する予定.  これまで配列解析をする際にどの種類データがどのデータベースにあるかがはっきりわかっていなかったのでまとめ.  ここではデータベース=一次データベースとして扱う.一次データベースとは,研…

Continue reading

Python for Biologists を終えて

 バイオインフォマティクス学習者向けのPythonの本として「Python for Biologists」という本がある。  現時点として日本語に翻訳はなされていないが、平易な英文で書かれているため、大学学部程度の学力があれば普通に読むことができる。  以下のURLから購入することができる。 htt…

Continue reading

SRA Toolkitの使い方 ~ インストールと設定 ~

はじめに(SRAとは) これから何回かに分けて自分で学びながら忘備録としてSRA Toolkitの使い方を残しておこうと思う。 SRA(Sequence Read Archive)を解析する方法として、SRA Toolkitを使う方法がある。というか、使わざるを得ない状況になってきている。 2022…

Continue reading

【Python】mRNAからタンパク質に翻訳するための辞書

 コドン表のCSVやPython用辞書、ありそうで探した時ぱっと見当たらなかったので置いておく。  普段あまり使う機会はないと思うが、学習用に。 ・CSV  codon_table.csv ・Python用コドン表辞書 codon_table = { ‘AUA’:’I’, ‘AUC’:’I’, ‘A…

Continue reading