RepeatModelerでアノテーション出来ないTEを分類するcTENOR

Dscf5987

ヒトやマウスなどのモデル生物ではRepbaseなどのリピート配列やTE(トランスポゾン)配列などのアノテーションが充実している。一方で、新規にゲノムを決定する・した生物ではそれがそもそもされていない場合が多い。 de novoでライブラリを作成し、アノテーションするパイプラインのゴールドスタンダード…

Continue reading

「ゲノム丸ごと」生成できるAI(基盤モデル) Evo

Evo

昨今の基盤モデル(Foundation model)の発展は著しい。OpenAIのGPTを筆頭にして世界各国様々な企業や組織が基盤モデルへの投資を加速させている。 我々一般的研究者としてはChatGPTを始め、CopilotやGeminiなど身近なところでも利用できる、基盤モデルをもとにしたアプリケ…

Continue reading

LASTZで全ゲノムをアライメント

Img 0064

2022/06/30 Seqkit のソート項目を追記 lastzについての日本語ドキュメントが少ないので備忘録として。 lastzはWhole genomeレベルでのアライメントができるツールである。 結構古くからあり有名なのでこの辺の説明は割愛。今も開発が続いている。 ダウンロードとインストール…

Continue reading

SRA Toolkitの使い方 ~ インストールと設定 ~

Sra Toolkit

はじめに(SRAとは) これから何回かに分けて自分で学びながら忘備録としてSRA Toolkitの使い方を残しておこうと思う。 SRA(Sequence Read Archive)を解析する方法として、SRA Toolkitを使う方法がある。というか、使わざるを得ない状況になってきている。 2022…

Continue reading