「最も古い」現生動物は何か?― カイメンとクシクラゲ論争

 色々と系統樹について勉強していく人はきっと「最も系統樹を遡っていった先にある生物はなんだろう?」と考えるだろう。生物全般についていえば、これはLUCA (The last universal common ancestor)と呼ばれる(仮説上の)生物にあたる。  すべての生物の共通祖先でなくとも、…

Continue reading

ScipyでDunnettの検定をする

 Scipyの最新バージョン(1.12.0)ではDunnettの検定が実装されている。Dunnett検定については別途調べてほしいが、多重検定のひとつだ。コントロールとなる群といくつかの実験群を比較し、検定する。  Scipyを使えば簡単にできる。以下は公式ドキュメントのサンプルの簡単な翻訳。 この…

Continue reading

Protein blast における ‘Positives’ はどんな意味か?

tblastn、blastp をして結果を眺めて整理していたとき、あまり気にしていなかったが “Positives” というスコアがあることに気づいた。 そのとなりにある “Identities” はアライメントされたアミノ酸残基の完全一致率、数を示し…

Continue reading

MyGene.info のAPIを叩いてみる

 タンパク質のRefSeqID(NPやXPから始まるID)を大量に持っていて、それをPython上でなんとかGene symbolに変換できないかを模索していた。  そんなとき、MyGene.info というサービスを見つけた。あまり日本語のドキュメントがないので軽く紹介しておく。 MyGene.i…

Continue reading

アフリカハイギョのシングルセルトランスクリプトームから魚の陸上適応を明らかにする

 ハイギョは現生魚類の中で最も陸上脊椎動物(両生類や有羊膜類など)に近い生物である。その名の通り肺を持っている魚である。エラも持っており、エラと肺、両方で呼吸ができる特殊な魚である(他にもポリプテルスなどが同様に肺とエラ両方持っている)。  また、一部のハイギョでは水が干上がった乾季などにおいては泥…

Continue reading

遺伝研スパコンのジョブの終了状態を確認する

 遺伝研スパコン(遺伝研スーパーコンピュータシステム)では、Grid Engine (SGE系)を採用している。この記事を読んでいる人(利用者)であれば、まず最初にqloginしろ、とか、ジョブを実行するときはスクリプトファイルをqsubしろ、とかを講習会などで最初に習うはずである。  無事終了する…

Continue reading

GFF/GTFアノテーションにIntron情報を追加する

 イントロンの解析をする際に、既存のGFF/GTFのアノテーションファイルにIntron情報が入っていない場合がある。そうしたときにちまちまエキソン情報から計算してもいいが、便利なツールがいくつかあるので紹介する。 AGATを使う  これが現状一番オススメの方法。GFF/GTFの変換のために使ったが…

Continue reading

ポリプテルスの寄生虫、ポリプティの駆除薬

リフィッシュ

研究室で飼育しているポリプテルスにポリプティ(種同定は行っていないが、他の魚への寄生が見られないことから)が発生した。 ネットで調べると「リフィッシュ」が良いとのことでリフィッシュを買おうとしたが2023年現在既に廃盤となり、入手困難である。今回は運良く近所の店に最後の1つがあったが、今は手に入らな…

Continue reading

codemlのCodonFreqの選択について

選択圧(淘汰圧)を解析するためにPAMLのcodemlがよく使われる。 いくつか日本語でも解説が書かれており、それに従って使っていることが多かったが、CodonFrequencyについての記述は日英共に解説が少ない。どうやって選択すべきか調べていたが、灯台もと暗しで知人がきちんと統計的なモデル選択の…

Continue reading