NCBIからリファレンスゲノムを取得する方法〜クォリティなどのチェックも〜 Kim 2024年12月14日 2024年12月14日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, NCBI, ゲノミクス 0 導入 ヒトやマウスといったモデル生物以外のゲノムが染色体レベルで組み上がる時代に突入している。ゲノム「解読」黎明期ではゲノムを決定することで様々な生命現象が明らかになると思われていたが、実際は一次元の塩基配列だけでわかることには限界があるということがその後段々と浸透していった。そのため現在では「ゲノ… Continue reading
脊椎動物最大! ハイギョのゲノム決定 (ハイギョ解説) Kim 2024年10月5日 2024年10月25日生物, 魚の陸上進化 ゲノミクス, ゲノム解析, 陸上進化, ハイギョ, ゲノム 2 2024年10月13日追記: イモリのゲノムについて ハイギョという魚は、通常の魚と同様にエラ呼吸をすることに加え、肺呼吸することができる。我々は肺呼吸しかできないが、祖先をたどると、デボン紀頃、エラ呼吸だけをしていた魚から肺呼吸をする魚が出現した。 現生の魚で肺呼吸を残しているのはハイギョという魚… Continue reading
「ゲノム丸ごと」生成できるAI(基盤モデル) Evo Kim 2024年5月28日 2024年11月18日ゲノム解析, 生物, バイオインフォマティクス ゲノム, ゲノミクス, 基盤モデル, ゲノム解析 1 2024年11月16日 追記: 本論文は Science に掲載されました。OAではなく筆者は読めないので、最新の内容を知りたい方は本文を参照してください。また、本記事はメジャーリビジョンの前のbioRxivのv3に基づいて執筆しています。最近公開されたv4では図が新しくなっているので、もしアクセス… Continue reading
MyGene.info のAPIを叩いてみる Kim 2023年9月14日 2024年10月24日Web, ゲノム解析, IT, Python, バイオインフォマティクス, Python NCBI, Web, ゲノミクス, Ensembl, Python, バイオインフォマティクス 0 タンパク質のRefSeqID(NPやXPから始まるID)を大量に持っていて、それをPython上でなんとかGene symbolに変換できないかを模索していた。 そんなとき、MyGene.info というサービスを見つけた。あまり日本語のドキュメントがないので軽く紹介しておく。 MyGene.i… Continue reading
bioawk で multiple FASTA の配列長を取得 Kim 2022年6月30日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, Linux, ゲノミクス 0 参考: Sequence length from Fasta マルチFASTA で、それぞれの配列の長さを出してほしい時がある。 そういったときに簡単に出力してくれるのがbioawkだ。 で、仮想環境上にインストール。 で、出力してくれる。 全部出すと長い場合、パイプで繋いでやって欲しい部分に絞って… Continue reading
配列解析におけるTwoBit File (2bit File) について Kim 2022年6月29日 2023年11月27日ゲノム解析, バイオインフォマティクス ゲノミクス, KentUtils, バイオインフォマティクス, ゲノム 0 バイオインフォマティクス関連で、稀にtwoBit file (2bit file) を使用する機会がある。 通常、ゲノムファイルなどのシーケンスデータはFASTA形式で頒布されているが、一部において効率的・高速な解析のためにtwoBit fileと呼ばれる形式が使用される。 UCSCによると、「ゲノ… Continue reading
脊椎動物最大ゲノムのハイギョのRNA-seq解析にはどの程度のスペックのパソコンが必要か? Kim 2021年12月24日 2024年2月21日RNA-seq, バイオインフォマティクス ハイギョ, RNA-seq, STAR, HISAT2, ゲノミクス, バイオインフォマティクス 0 タイトルの通り。これからハイギョのRNA-seq解析などをしたいという稀有な研究者に向けたメモ。 BLAST 正直BLASTするだけならそこまでスペックはいらない。他のゲノムと比べると時間がかかるが、数コアでも十分可能。 STAR を用いた RNA-seq マッピング RNA-seqでもTrinit… Continue reading
LASTZで全ゲノムをアライメント Kim 2021年10月21日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, ゲノム解析, ゲノミクス, アライメント 0 2022/06/30 Seqkit のソート項目を追記 lastzについての日本語ドキュメントが少ないので備忘録として。 lastzはWhole genomeレベルでのアライメントができるツールである。 結構古くからあり有名なのでこの辺の説明は割愛。今も開発が続いている。 ダウンロードとインストール… Continue reading
TE配列の分類を行うDeepTEの使い方 Kim 2021年9月12日 2023年11月27日ゲノム解析, バイオインフォマティクス ゲノミクス, トランスポゾン, DeepTE, バイオインフォマティクス 0 最近は転移因子(TE、トランスポゾン)の話が連日続いているが、今回は前回の記事で紹介した機械学習によるTE分類ツールの1つ、DeepTE (Yan et al., 2020) を実際に使ってみる。 Yan, H., Bombarely, A., & Li, S. (2020). D… Continue reading
転移因子(TE)の分類ツール: ClassifyTE、DeepTE Kim 2021年8月24日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, ゲノミクス, トランスポゾン 0 転移因子(トランスポゾン、TE)はゲノムのある位置からある位置へと飛んでいくというDNA配列である。様々な真核生物においてゲノムに存在し、様々な役割を担っていたり、あるいは単純に「ジャンクDNA」であるようなものも存在する(最初はジャンクとして見られていたけど近年になって様々な役割が明らかにされてき… Continue reading