アフリカハイギョのシングルセルトランスクリプトームから魚の陸上適応を明らかにする Kim 2023年9月14日 2024年8月16日RNA-seq, 生物, 魚の陸上進化, バイオインフォマティクス バイオインフォマティクス, 陸上進化, ハイギョ, RNA-seq, scRNA-seq 0 ハイギョは現生魚類の中で最も陸上脊椎動物(両生類や有羊膜類など)に近い生物である。その名の通り肺を持っている魚である。エラも持っており、エラと肺、両方で呼吸ができる特殊な魚である(他にもポリプテルスなどが同様に肺とエラ両方持っている)。 また、一部のハイギョでは水が干上がった乾季などにおいては泥… Continue reading
遺伝研スパコンのジョブの終了状態を確認する Kim 2023年8月2日 2023年11月27日バイオインフォマティクス Linux, スーパーコンピュータ 0 遺伝研スパコン(遺伝研スーパーコンピュータシステム)では、Grid Engine (SGE系)を採用している。この記事を読んでいる人(利用者)であれば、まず最初にqloginしろ、とか、ジョブを実行するときはスクリプトファイルをqsubしろ、とかを講習会などで最初に習うはずである。 無事終了する… Continue reading
GFF/GTFアノテーションにIntron情報を追加する Kim 2023年7月18日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, GTF, GFF, ゲノムアノテーション 0 イントロンの解析をする際に、既存のGFF/GTFのアノテーションファイルにIntron情報が入っていない場合がある。そうしたときにちまちまエキソン情報から計算してもいいが、便利なツールがいくつかあるので紹介する。 AGATを使う これが現状一番オススメの方法。GFF/GTFの変換のために使ったが… Continue reading
codemlのCodonFreqの選択について Kim 2022年11月11日 2023年11月27日バイオインフォマティクス PAML, 淘汰圧解析, バイオインフォマティクス, 配列解析, codeml 0 選択圧(淘汰圧)を解析するためにPAMLのcodemlがよく使われる。 いくつか日本語でも解説が書かれており、それに従って使っていることが多かったが、CodonFrequencyについての記述は日英共に解説が少ない。どうやって選択すべきか調べていたが、灯台もと暗しで知人がきちんと統計的なモデル選択の… Continue reading
NCBI のAPIで”API rate limit exceeded”と出る Kim 2022年10月25日 2023年11月27日バイオインフォマティクス NCBI, Web 0 NCBIのAPIでFASTAなどを取得するツールを作っているのだが、非同期処理を導入して大量に並列取得をしようとしたところ”API rate limit exceeded”とエラーが出ていることが判明した。 ググると以下のページのように、アクセス制限が存在することが明らかにな… Continue reading
bioawk で multiple FASTA の配列長を取得 Kim 2022年6月30日 2023年11月27日ゲノム解析, バイオインフォマティクス Linux, ゲノミクス, バイオインフォマティクス 0 参考: Sequence length from Fasta マルチFASTA で、それぞれの配列の長さを出してほしい時がある。 そういったときに簡単に出力してくれるのがbioawkだ。 で、仮想環境上にインストール。 で、出力してくれる。 全部出すと長い場合、パイプで繋いでやって欲しい部分に絞って… Continue reading
配列解析におけるTwoBit File (2bit File) について Kim 2022年6月29日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, ゲノム, ゲノミクス, KentUtils 0 バイオインフォマティクス関連で、稀にtwoBit file (2bit file) を使用する機会がある。 通常、ゲノムファイルなどのシーケンスデータはFASTA形式で頒布されているが、一部において効率的・高速な解析のためにtwoBit fileと呼ばれる形式が使用される。 UCSCによると、「ゲノ… Continue reading
FASTAのヘッダ(名前)の行だけ抽出 Kim 2022年5月28日 2023年11月27日バイオインフォマティクス 0 何度も忘れてググるので備忘録。 “”を忘れると、対象のファイルがおかしなことになる(消える)ので注意。 Continue reading
脊椎動物最大ゲノムのハイギョのRNA-seq解析にはどの程度のスペックのパソコンが必要か? Kim 2021年12月24日 2024年2月21日RNA-seq, バイオインフォマティクス ゲノミクス, バイオインフォマティクス, ハイギョ, RNA-seq, STAR, HISAT2 0 タイトルの通り。これからハイギョのRNA-seq解析などをしたいという稀有な研究者に向けたメモ。 BLAST 正直BLASTするだけならそこまでスペックはいらない。他のゲノムと比べると時間がかかるが、数コアでも十分可能。 STAR を用いた RNA-seq マッピング RNA-seqでもTrinit… Continue reading
LASTZで全ゲノムをアライメント Kim 2021年10月21日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, ゲノム解析, ゲノミクス, アライメント 0 2022/06/30 Seqkit のソート項目を追記 lastzについての日本語ドキュメントが少ないので備忘録として。 lastzはWhole genomeレベルでのアライメントができるツールである。 結構古くからあり有名なのでこの辺の説明は割愛。今も開発が続いている。 ダウンロードとインストール… Continue reading