VGP(脊椎動物ゲノムプロジェクト)のポリシー改定について

背景

近年の次世代、あるいはロングリードシーケンサなどの発展に伴い、生物のゲノム決定が容易になっている。NCBI Genomeなどを覗くと、実に様々なマイナーな生物までゲノムがChromosomeレベルで決定されているのを目にすることが多いだろう。高品質な脊椎動物のゲノムが多く登録されており、アノテーションまでついているため、大規模な比較解析などを行う研究者にとっては大変ありがたいものである。

しかし既に公開されている多くのゲノムは論文の出版に至っているものは少なく、大半は登録されているのみというのが現状だ。それらのゲノムはVGP(Vertebrate Genome Project)という脊椎動物のゲノム決定を網羅的に行おう! という世界的なコンソーシアムによって決定されているものであり、利用・出版にはポリシーが定められている

VGPが掲げる目標は、現在生存する約70,000種の脊椎動物すべてを高品質でエラーなく、ギャップなし、染色体レベルのアノテーション付きゲノムを公開するというものである。

現在どんな生物が読まれているかは、こちらのスプレッドシートから進捗状況を確認できる。また、NCBIなどに登録されていない種でもこちらのGenome arkから探すことができる。アセンブル配列の登録名が特徴的(例えば魚であれば”f”が接頭辞につく)なので、すぐにわかるだろう。

以前これについて記事にしたことがあるが、様々な制約があり、度々アップデートされていることを確認していた(いちいち追うのも大変ではあるが、CNSなどの大きいジャーナルに投稿する際は細心の注意を払う必要がある)。

以前までは上記の記事のようなポリシーに従って禁輸期間(エンバーゴ/情報公開解禁日の私の意訳)が明確ではなかったが、この度その禁輸期間について明確に、かつ、より研究が加速するような大きなポリシー改定があったため、記事に書き起こす。

VGPデータ利用ポリシーの改定

本記事は執筆時点(2024年11月2日)におけるものであることを最初に述べておく。

改訂版禁輸措置ポリシー 2024 年 5 月 1 日に実施 最終更新日 2024 年 7 月 8 日

この改訂版に沿って解説していく。もし最新版を確認する場合、こちらのリンクから確認していただきたい。

今回、2024年5月1日から実施された新ポリシーは、大幅な規制緩和策が盛り込まれている。具体的な内容について、以下に簡潔にまとめる。

  • 禁輸期間が以前の2年から1年に短縮
    • アノテーション付きゲノムアセンブリがNCBIなどに登録された日を起点とし、1年は投稿者が優先的にゲノム論文などの公表権を有する
    • その日以降については自由に、かつ無制限に利用可能
    • アノテーションなしのゲノムアセンブリの場合、登録日が解禁日となる
  • 利用の無制限化に伴い、以前の記事で書いたようなVGPコンソーシアムによる大規模ゲノム解析も可能となる
    • ただし、VGPコンソーシアムとして、15のゲノムプロジェクトは実施される予定のようである
  • 一部VGP傘下にある禁輸期間がそもそもない・一年未満のゲノムプロジェクトについては今まで通りの公開猶予期間が与えられる
  • 公開から1年未満のゲノムを使う場合、以下の項目については許可なく利用できる
    • 種をまたいだ単一の遺伝子座または単一の遺伝子ファミリー
    • 種内の最大 5 つの遺伝子座または遺伝子ファミリーの分析
    • マッピング先のリファレンスゲノムとしての利用

多くの研究者にとって、これは嬉しいポリシーの改定だと思われる。おそらくVGP側も、シーケンスの速度品質向上と論文を書ける人材の不足、問い合わせの増加などなど様々な背景があっての改定ではなかろうか。

例外

ただし、例外が存在する。

このポリシーは2024年5月1日より公開されたゲノムにのみ当てはまるポリシーであり、それ以前のものは以前のまま「2年の禁輸期間(エンバーゴ)」が存在するということだ。

具体例を見よう。

例えば先日、ついにかねてより待ちわびていたシーラカンスの染色体レベルのアセンブリ配列が公開された。このリンクからNCBI Genomeにアクセスできる。

Image

さて、問題なのは公開日だ。

この配列は2024年3月18日に公開されており、これは新ポリシー適用以前のデータであるため、2年の禁輸期間が設けられている。つまり、利用・出版が可能になるのは早くて2026年3月18日ということだ。

では、次に最近公開されたイモリのゲノムを見てみよう。これはホクオウクシイモリというクシイモリの仲間だが、ゲノムが公開されている。

Image

これは公開日が2024年7月31日なので、新ポリシーが適用される。そのため、出版は2025年7月31日以降に可能になる、という解釈のはずだ。

早い!

嬉しい!

VGPバンザイ! という気持ちである。

宣伝

媚を売っておく。

VGPでは上記で述べたように7万種の全ゲノムを決定しようとしている野心的なプロジェクトである。もし懐に余裕のある方がいらっしゃるようであれば、ぜひともパトロンになっていただけないだろうか。よろしくお願いします。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です