生命科学における量子計算アプローチ Kim 2024年4月18日 2024年4月18日ゲノム解析, バイオインフォマティクス 量子コンピュータ, バイオインフォマティクス, 量子力学 0 今回は量子コンピュータが生命科学にどういう形でアプローチできるのか、最近(2022年)のレビューを通じて紹介したい。量子コンピュータに限らず、現在の動向を色々と抑えて書き留めたいと思う。 最近の計算生命科学(バイオインフォ)の動向 最近のバイオインフォマティクスの分野の発展は著しい。特にタンパク質の… Continue reading
RNA velocity について Kim 2024年4月12日 2024年4月12日RNA-seq, バイオインフォマティクス RNA-seq, scRNA-seq 0 今回は RNA velocity (直訳するとRNA速度だが、適切な語訳ではないため、RNA velocityとして記述する)について説明する。 RNA velocity の基礎知識 RNA velocity は2018年に La Manno らが発表・提唱したもので、(一般に)scRNA-seq … Continue reading
ScipyでDunnettの検定をする Kim 2024年1月29日 2024年1月29日IT, Python, バイオインフォマティクス, Python Python 0 Scipyの最新バージョン(1.12.0)ではDunnettの検定が実装されている。Dunnett検定については別途調べてほしいが、多重検定のひとつだ。コントロールとなる群といくつかの実験群を比較し、検定する。 Scipyを使えば簡単にできる。以下は公式ドキュメントのサンプルの簡単な翻訳。 この… Continue reading
Protein blast における ‘Positives’ はどんな意味か? Kim 2023年12月30日 2023年12月30日バイオインフォマティクス バイオインフォマティクス, NCBI, アライメント, BLAST 0 tblastn、blastp をして結果を眺めて整理していたとき、あまり気にしていなかったが “Positives” というスコアがあることに気づいた。 そのとなりにある “Identities” はアライメントされたアミノ酸残基の完全一致率、数を示し… Continue reading
MyGene.info のAPIを叩いてみる Kim 2023年9月14日 2023年11月27日ゲノム解析, Web, IT, Python, バイオインフォマティクス, Python ゲノミクス, Ensembl, Python, バイオインフォマティクス, NCBI, Web 0 タンパク質のRefSeqID(NPやXPから始まるID)を大量に持っていて、それをPython上でなんとかGene symbolに変換できないかを模索していた。 そんなとき、MyGene.info というサービスを見つけた。あまり日本語のドキュメントがないので軽く紹介しておく。 MyGene.i… Continue reading
アフリカハイギョのシングルセルトランスクリプトームから魚の陸上適応を明らかにする Kim 2023年9月14日 2023年11月27日RNA-seq, 生物, 魚の陸上進化, バイオインフォマティクス scRNA-seq, バイオインフォマティクス, 陸上進化, ハイギョ, RNA-seq 0 ハイギョは現生魚類の中で最も陸上脊椎動物(両生類や有羊膜類など)に近い生物である。その名の通り肺を持っている魚である。エラも持っており、エラと肺、両方で呼吸ができる特殊な魚である(他にもポリプテルスなどが同様に肺とエラ両方持っている)。 また、一部のハイギョでは水が干上がった乾季などにおいては泥… Continue reading
遺伝研スパコンのジョブの終了状態を確認する Kim 2023年8月2日 2023年11月27日バイオインフォマティクス Linux, スーパーコンピュータ 0 遺伝研スパコン(遺伝研スーパーコンピュータシステム)では、Grid Engine (SGE系)を採用している。この記事を読んでいる人(利用者)であれば、まず最初にqloginしろ、とか、ジョブを実行するときはスクリプトファイルをqsubしろ、とかを講習会などで最初に習うはずである。 無事終了する… Continue reading
GFF/GTFアノテーションにIntron情報を追加する Kim 2023年7月18日 2023年11月27日ゲノム解析, バイオインフォマティクス バイオインフォマティクス, GTF, GFF, ゲノムアノテーション 0 イントロンの解析をする際に、既存のGFF/GTFのアノテーションファイルにIntron情報が入っていない場合がある。そうしたときにちまちまエキソン情報から計算してもいいが、便利なツールがいくつかあるので紹介する。 AGATを使う これが現状一番オススメの方法。GFF/GTFの変換のために使ったが… Continue reading
codemlのCodonFreqの選択について Kim 2022年11月11日 2023年11月27日バイオインフォマティクス バイオインフォマティクス, 配列解析, codeml, PAML, 淘汰圧解析 0 選択圧(淘汰圧)を解析するためにPAMLのcodemlがよく使われる。 いくつか日本語でも解説が書かれており、それに従って使っていることが多かったが、CodonFrequencyについての記述は日英共に解説が少ない。どうやって選択すべきか調べていたが、灯台もと暗しで知人がきちんと統計的なモデル選択の… Continue reading
NCBI のAPIで”API rate limit exceeded”と出る Kim 2022年10月25日 2023年11月27日バイオインフォマティクス NCBI, Web 0 NCBIのAPIでFASTAなどを取得するツールを作っているのだが、非同期処理を導入して大量に並列取得をしようとしたところ”API rate limit exceeded”とエラーが出ていることが判明した。 ググると以下のページのように、アクセス制限が存在することが明らかにな… Continue reading