NCBI のAPIで”API rate limit exceeded”と出る

NCBIのAPIでFASTAなどを取得するツールを作っているのだが、非同期処理を導入して大量に並列取得をしようとしたところ”API rate limit exceeded”とエラーが出ていることが判明した。 ググると以下のページのように、アクセス制限が存在することが明らかにな…

Continue reading

bioawk で multiple FASTA の配列長を取得

参考: Sequence length from Fasta マルチFASTA で、それぞれの配列の長さを出してほしい時がある。 そういったときに簡単に出力してくれるのがbioawkだ。 で、仮想環境上にインストール。 で、出力してくれる。 全部出すと長い場合、パイプで繋いでやって欲しい部分に絞って…

Continue reading

配列解析におけるTwoBit File (2bit File) について

バイオインフォマティクス関連で、稀にtwoBit file (2bit file) を使用する機会がある。 通常、ゲノムファイルなどのシーケンスデータはFASTA形式で頒布されているが、一部において効率的・高速な解析のためにtwoBit fileと呼ばれる形式が使用される。 UCSCによると、「ゲノ…

Continue reading

2年ぶり再訪! 進化したカワスイ

以前カワスイ(川崎水族館)のオープン初日に行ったというレビューを書いた。後輩に「めちゃ書くやん」と言われて読み返すとたしかに……。しかも最後に「再訪する」と書きながらもなんやかんやで2年近くが経過してしまっていた。今回再び訪れる機会があったのでレビューをしたいと思う。 オープン初日は長蛇の列→空いて…

Continue reading

学振とJST次世代等の助成金の確定申告

毎年この季節になると確定申告でざわつくが、学振と今年度から始まった次世代研究者挑戦的研究プログラム(JST次世代)とでは確定申告や税に関する申告が異なるので要注意。 簡単に書き留めておく。 学振(日本学術振興会特別研究員DC1/2, PD) 雇用関係はないものの、しっかりと源泉徴収されている。給与所…

Continue reading

脊椎動物最大ゲノムのハイギョのRNA-seq解析にはどの程度のスペックのパソコンが必要か?

タイトルの通り。これからハイギョのRNA-seq解析などをしたいという稀有な研究者に向けたメモ。 BLAST 正直BLASTするだけならそこまでスペックはいらない。他のゲノムと比べると時間がかかるが、数コアでも十分可能。 STAR を用いた RNA-seq マッピング RNA-seqでもTrinit…

Continue reading

ハイギョの繭は生きた細胞で、外環境から身を守る

ハイギョは最も両生類に近い、現在生きている魚である。 「生きた化石」とも呼ばれ、またその名の通り肺を持つ魚としても知られている。 肺を持つ、ということは空気呼吸が可能であり、陸上で生活できることが知られている。 実際、アフリカや南アメリカに生息するハイギョは陸上で生き延びることができ、乾季になると土…

Continue reading

LASTZで全ゲノムをアライメント

2022/06/30 Seqkit のソート項目を追記 lastzについての日本語ドキュメントが少ないので備忘録として。 lastzはWhole genomeレベルでのアライメントができるツールである。 結構古くからあり有名なのでこの辺の説明は割愛。今も開発が続いている。 ダウンロードとインストール…

Continue reading

TE配列の分類を行うDeepTEの使い方

最近は転移因子(TE、トランスポゾン)の話が連日続いているが、今回は前回の記事で紹介した機械学習によるTE分類ツールの1つ、DeepTE (Yan et al., 2020) を実際に使ってみる。 Yan, H., Bombarely, A., & Li, S. (2020). D…

Continue reading