bioawk で multiple FASTA の配列長を取得 Kim 2022年6月30日 2022年6月30日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, Linux, ゲノミクス 参考: Sequence length from Fasta マルチFASTA で、それぞれの配列の長さを出してほしい時がある。 そういったときに簡単に出力してくれるのがbioawkだ。 で、仮想環境上にインストール。 で、出力してくれる。 全部出すと長い場合、パイプで繋いでやって欲しい部分に絞って… Continue reading
配列解析におけるTwoBit File (2bit File) について Kim 2022年6月29日 2022年7月18日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, ゲノム, ゲノミクス, KentUtils バイオインフォマティクス関連で、稀にtwoBit file (2bit file) を使用する機会がある。 通常、ゲノムファイルなどのシーケンスデータはFASTA形式で頒布されているが、一部において効率的・高速な解析のためにtwoBit fileと呼ばれる形式が使用される。 UCSCによると、「ゲノ… Continue reading
FASTAのヘッダ(名前)の行だけ抽出 Kim 2022年5月28日 2022年6月29日未分類 何度も忘れてググるので備忘録。 “”を忘れると、対象のファイルがおかしなことになる(消える)ので注意。 Continue reading
2年ぶり再訪! 進化したカワスイ Kim 2022年3月4日 2022年3月11日生物, 日記 水族館 以前カワスイ(川崎水族館)のオープン初日に行ったというレビューを書いた。後輩に「めちゃ書くやん」と言われて読み返すとたしかに……。しかも最後に「再訪する」と書きながらもなんやかんやで2年近くが経過してしまっていた。今回再び訪れる機会があったのでレビューをしたいと思う。 オープン初日は長蛇の列→空いて… Continue reading
学振とJST次世代等の助成金の確定申告 Kim 2022年2月3日 2022年2月3日その他 学振DC, 博士課程, 学振 毎年この季節になると確定申告でざわつくが、学振と今年度から始まった次世代研究者挑戦的研究プログラム(JST次世代)とでは確定申告や税に関する申告が異なるので要注意。 簡単に書き留めておく。 学振(日本学術振興会特別研究員DC1/2, PD) 雇用関係はないものの、しっかりと源泉徴収されている。給与所… Continue reading
脊椎動物最大ゲノムのハイギョのRNA-seq解析にはどの程度のスペックのパソコンが必要か? Kim 2021年12月24日 2021年12月24日RNA-seq, バイオインフォマティクス ゲノミクス, バイオインフォマティクス, ハイギョ, RNA-seq, STAR, HISAT2 タイトルの通り。これからハイギョのRNA-seq解析などをしたいという稀有な研究者に向けたメモ。 BLAST 正直BLASTするだけならそこまでスペックはいらない。他のゲノムと比べると時間がかかるが、数コアでも十分可能。 STAR を用いた RNA-seq マッピング RNA-seqでもTrinit… Continue reading
ハイギョの繭は生きた細胞で、外環境から身を守る Kim 2021年12月20日 2021年12月20日生物, 魚の陸上進化 生物, 進化生物学, 陸上進化, ハイギョ ハイギョは最も両生類に近い、現在生きている魚である。 「生きた化石」とも呼ばれ、またその名の通り肺を持つ魚としても知られている。 肺を持つ、ということは空気呼吸が可能であり、陸上で生活できることが知られている。 実際、アフリカや南アメリカに生息するハイギョは陸上で生き延びることができ、乾季になると土… Continue reading
LASTZで全ゲノムをアライメント Kim 2021年10月21日 2022年6月30日ゲノム解析, バイオインフォマティクス ゲノム解析, ゲノミクス, アライメント, バイオインフォマティクス 2022/06/30 Seqkit のソート項目を追記 lastzについての日本語ドキュメントが少ないので備忘録として。 lastzはWhole genomeレベルでのアライメントができるツールである。 結構古くからあり有名なのでこの辺の説明は割愛。今も開発が続いている。 ダウンロードとインストール… Continue reading
TE配列の分類を行うDeepTEの使い方 Kim 2021年9月12日 2021年9月12日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, ゲノミクス, トランスポゾン, DeepTE 最近は転移因子(TE、トランスポゾン)の話が連日続いているが、今回は前回の記事で紹介した機械学習によるTE分類ツールの1つ、DeepTE (Yan et al., 2020) を実際に使ってみる。 Yan, H., Bombarely, A., & Li, S. (2020). D… Continue reading
転移因子(TE)の分類ツール: ClassifyTE、DeepTE Kim 2021年8月24日 2021年8月24日ゲノム解析, バイオインフォマティクス ゲノミクス, トランスポゾン, バイオインフォマティクス 転移因子(トランスポゾン、TE)はゲノムのある位置からある位置へと飛んでいくというDNA配列である。様々な真核生物においてゲノムに存在し、様々な役割を担っていたり、あるいは単純に「ジャンクDNA」であるようなものも存在する(最初はジャンクとして見られていたけど近年になって様々な役割が明らかにされてき… Continue reading