VGP(脊椎動物ゲノムプロジェクト)のポリシー改定について

Vgp

背景 近年の次世代、あるいはロングリードシーケンサなどの発展に伴い、生物のゲノム決定が容易になっている。NCBI Genomeなどを覗くと、実に様々なマイナーな生物までゲノムがChromosomeレベルで決定されているのを目にすることが多いだろう。高品質な脊椎動物のゲノムが多く登録されており、アノテ…

Continue reading

RepeatModelerでアノテーション出来ないTEを分類するcTENOR

Dscf5987

ヒトやマウスなどのモデル生物ではRepbaseなどのリピート配列やTE(トランスポゾン)配列などのアノテーションが充実している。一方で、新規にゲノムを決定する・した生物ではそれがそもそもされていない場合が多い。 de novoでライブラリを作成し、アノテーションするパイプラインのゴールドスタンダード…

Continue reading

IBM ゲート型量子コンピュータを用いたmRNA二次構造の予測

Image 4

近年量子コンピュータが注目されているが、応用先については「創薬」「金融」といった抽象的なものはよく取り上げられるが実際どの程度の具体的な事例に適用できるかについてはあまり耳にしないと思う。 今回はIBMとモデルナ(新型コロナウイルスのmRNAワクチンで有名になった会社)が実際に協働して量子コンピュー…

Continue reading

「ゲノム丸ごと」生成できるAI(基盤モデル) Evo

Evo

2024年11月16日 追記: 本論文は Science に掲載されました。OAではなく筆者は読めないので、最新の内容を知りたい方は本文を参照してください。また、本記事はメジャーリビジョンの前のbioRxivのv3に基づいて執筆しています。最近公開されたv4では図が新しくなっているので、もしアクセス…

Continue reading

生命科学における量子計算アプローチ

Image 9

今回は量子コンピュータが生命科学にどういう形でアプローチできるのか、最近(2022年)のレビューを通じて紹介したい。量子コンピュータに限らず、現在の動向を色々と抑えて書き留めたいと思う。 最近の計算生命科学(バイオインフォ)の動向 最近のバイオインフォマティクスの分野の発展は著しい。特にタンパク質の…

Continue reading

ScipyでDunnettの検定をする

Rounded Corners

 Scipyの最新バージョン(1.12.0)ではDunnettの検定が実装されている。Dunnett検定については別途調べてほしいが、多重検定のひとつだ。コントロールとなる群といくつかの実験群を比較し、検定する。  Scipyを使えば簡単にできる。以下は公式ドキュメントのサンプルの簡単な翻訳。 この…

Continue reading

Protein blast における ‘Positives’ はどんな意味か?

Image

tblastn、blastp をして結果を眺めて整理していたとき、あまり気にしていなかったが “Positives” というスコアがあることに気づいた。 そのとなりにある “Identities” はアライメントされたアミノ酸残基の完全一致率、数を示し…

Continue reading

MyGene.info のAPIを叩いてみる

Image 8

 タンパク質のRefSeqID(NPやXPから始まるID)を大量に持っていて、それをPython上でなんとかGene symbolに変換できないかを模索していた。  そんなとき、MyGene.info というサービスを見つけた。あまり日本語のドキュメントがないので軽く紹介しておく。 MyGene.i…

Continue reading

アフリカハイギョのシングルセルトランスクリプトームから魚の陸上適応を明らかにする

Lungfish Estivation

 ハイギョは現生魚類の中で最も陸上脊椎動物(両生類や有羊膜類など)に近い生物である。その名の通り肺を持っている魚である。エラも持っており、エラと肺、両方で呼吸ができる特殊な魚である(他にもポリプテルスなどが同様に肺とエラ両方持っている)。  また、一部のハイギョでは水が干上がった乾季などにおいては泥…

Continue reading