最近いくらゲノムを読む価格が下がったとはいえ、マニアックすぎるような生物(前に紹介したアシナシイモリのゲノムのように)が大量にNCBIやEnsembleに登録されるようになってきた。アミメウナギまで登録されており、誰がやってるんだと不思議に思っていた。
わーいやったぜ みたいなノリで使って、論文執筆している最中に「引用する論文がまだ出ていない」事に気づいた。というか最初からないことには気づいていたが、いくらなんでも1年間出ないことはないだろうと思っていた。
Submitterは決まって「National Center for Biotechnology Information」。普通研究グループだとか著者の名前が出てくるんじゃないのかと思ったが、どうやら違う。何かおかしい。
慎重にデータを見ていくと、サンガー研究所がそれを行っていることに気づき、Vertebrate Genome Project の存在を知った。
国際的な研究プロジェクトで脊椎動物のゲノムを大量に読むことを組織的に行っているようで、うちのボスもあまり知らなかったようだ。(助教は知ってた、もっと前に教えてほしかった……)
で、ただゲノムを読んで公開して解析をしない、論文を書かないなんてことがあるはずがなく、彼らが何らかの権利を有していると考え、規約を読むと……ビンゴ、彼らが持つデータに対する権利が書かれていた。
Vertebrate Genome Project の規約
規約はこのページに書かれている。身元不明だと思われたゲノムデータについては必ず参照して利用できるかどうか確かめる必要がある。
NCBIやEnsembleに公開されているにも関わらず、VGPのメンバーにはそれを用いた例えば以下のような研究について許可が必要となる。
- 脊椎動物のゲノム規模の家系図
- 各脊椎動物系統における特殊な形質の比較ゲノミクス
- 収束特性の比較ゲノミクス(例えば、音声学習、飛行、手足の喪失、 水生/陸生 適応)
- 脊椎動物全体に共通する遺伝子オーソロジーと命名法の開発
- 脊椎動物染色体ゲノム進化の解読
- すべての脊椎動物と主要な脊椎動物クレードの共通の祖先ゲノムの再構築(哺乳類、鳥、爬虫類、両生類、硬骨魚、真骨魚、顎口類(サメを指しているだろう)、および四肢動物など)
- ヌクレオチドのヒトゲノムの染色体への進化
- ある系統が他の系統よりも病気に強い理由の遺伝学
- 絶滅危惧種の保護ゲノム解析
- 地球上に残っているすべてのフクロウオウムのゲノム
- 脊椎動物にわたる家畜化の遺伝的特徴
- 脊椎動物間の性決定および性染色体進化の遺伝学
- ゲノミクスとトランスクリプトミクスを使用した脳細胞タイプの進化と相同性
- 脊椎動物全体の3次元ゲノム構造
- トランスポゾンと宿主因子の間の進化的戦いの結果
これらの研究についてはグループに許可を得なければ論文は投稿できない。Nature や Science といった著名な科学雑誌もそれらの規約を批准しているので容赦なく弾かれる(そういった話も実際にある)。
上記以外にも、系統解析や進化解析などを含む、全ゲノム解析などはデータの提供者よりも先にPublishしてはならない。講演なども含まれるようだ。またこの規約は2020/01/17現在確認したものであり、今後変わる可能性と明記されている。
ポリシーには例外があり、それは以下のように示されている。
“単一の遺伝子座、種の単一の遺伝子ファミリー、または複数の種全体で最大5つの遺伝子座の分析は例外として認める。また、リファレンスゲノムとしてマッピングに使用することも認める”
今書いている論文はギリギリこのポリシーに引っかからないはずなので、とりあえず胸をなでおろした。
NCBIとかにも示しておいてほしかったが、とりあえず知ることができてよかった。日本人であまり国際的にゲノム解読プロジェクトに携わっていない進化生物学の学生らは知っておくべき話だろうということで今回まとめておいた。
ちなみに現在VGPが読んでいる最中のゲノムは以下のスプレッドシートからわかる。
https://docs.google.com/spreadsheets/d/1ZBR5BrRQIgVWX9UPuKvg43hz7OK6_kgvKOcth6atIv0/edit#gid=0
NCBI等にも未公開のゲノムデータ
2020-04-13 追記
こちらのページからNCBI等でも未公開となっているゲノムデータを得ることができる。ただし規約は守らなねばならない。
ピンバック:現生最古の両生類 アシナシイモリのゲノムが相次いで公開される – Kim Biology & Informatics