VaDE

ドキュメント

VaDE version 1.7(2016-9-20 released)

Page top

VaDEとは

VaDE 概要

VarySysDB Disease Edition(VaDE)データベースは、さまざまな疾患へのかかりやすさや薬剤応答性などの形質に関わるヒトゲノム多型の情報を、多数の学術論文から収集したデータベースです。

VaDEデータベースに格納されているデータは、主にヒトの疾患や薬剤応答性に関わるゲノム多型です。そのほか、身長や体重などの一般的形質に関わるゲノム多型も多数含まれます。これらの多型について、オッズ比やβ値、研究対象の集団、P値などの豊富な情報を提供しています。さらに、複数の独立な研究における再現性の有無を評価しています。

VaDEデータベースを使うことにより、信頼性の高い疾患感受性ゲノム多型の情報を容易に検索して取得できます。この情報は、個人のゲノム情報と照らし合わせることにより個人の疾患感受性を予測する研究に使うことができ、将来の予防医療への応用が期待されます。このほか創薬や法医学、人類学など幅広い分野に利用可能であり、本データベースの役割は今後ますます重要になることが期待されます。

各種ページの詳細情報および利用手順

VaDEデータベース利用手順書をご参照ください。

VaDE Manual verion 1.1 released.

データベース構築

データベース構築詳細

SNP-形質関連解析データ

VaDE のSNP-形質関連解析データは1. The NHGRI-EBI Catalog of published genome-wide association studies (NHGRI-EBI GWAS catalog) http://www.ebi.ac.uk/gwas/由来のデータ、及び2. VaDE独自のデータから成り立っています。

1. NHGRI-EBI GWAS catalogに掲載されたデータを再マニュアルキュレーションし、データの確認及び追加・修正・フォーマットの変更作業を行っております。2. VaDEチームによる網羅的なマニュアルキュレーションが現在進行中です。外部から提供されたデータに関しても、VaDEチームによる確認プロセスを経て、内部に取り込んでいます。個々のデータの詳細に関しては下記のリリースヒストリーをご参照ください。

なお、関連解析結果は様々な遺伝的モデルが利用されていますが、VaDEではアレリックモデルとアディティブモデルに統一し、劣性モデル、優性モデルの結果を除外しています。

人類集団、疾患名、遺伝子オントロジーの標準化

VaDEでは各関連解析結果に加え、それぞれの研究で用いられたサンプルの人類集団(祖先)、民族及び国籍の情報を提供しています。国名と人類集団の用語はthe World Factbook of CIAComposition of regions of United Nations Statistics Divisionを参考に標準化しています。

サンプルの人類集団情報は以下の11の集団に分類されます。

形質や疾患は疾患、一般的形質、ファーマコゲノミクスの3つのカテゴリーに分類されます。また、全ての疾患はUnified Medical Language System (UMLS)を用いた機械的紐づけとマニュアルキュレーションにより国際疾病分類第10版(ICD-10)の分類が適用されています。SNP座標はdbSNP137に基づいています。報告遺伝子はオリジナル論文に報告されている遺伝子です。

再現性の評価

SNP-形質関連解析の再現性の評価には、統計的に有意(GWAS: P値 ≤ 1.0 × 10-5、replication study: P値 ≤ 0.05)であり、かつ単一の人類集団によるデータを用いて検証しています。

2段階研究など、同じ論文内で独立した集団を用いた研究が複数回実施されている場合、それぞれの関連解析結果が得られるまでに用いられた各段階ごとの研究のうち統計的に有意な研究数を全てカウントしています。ついで、人類集団、形質、SNPリスクアレルの組み合わせごとに、独立した論文間での統計的に有意な研究数の合計を取得し、再現性を検証しています。論文内及び論文間の独立した研究によって再現性が認められたSNP-形質関連解析は「集団別再現SNP」のページより提供しています。

機能的ゲノム領域のデータ

ENCODEプロジェクトによる、ChIP-seq、DNase I高感受性領域、制御モチーフなどの実験データ、ENCODE/BroadおよびNIH Roadmap Epigenomics Mapping Consortiumによるクロマチン状態セグメントデータ、RefSeq遺伝子アノテーションデータはHaploreg v2よりダウンロードしました。SNPに対するH-InvDB転写産物のアノテーションデータはVarySysDBより取得しました。1000 Genomes Projectに基づくSNPの上流下流3000SNPsの連鎖不平衡(LD)係数は、Center for Statistical Genetics、University of Michiganにより提供されています。詳細な解析方法はhttp://www.sph.umich.edu/csg/abecasis/MACH/download/1000G.2012-02-14.htmlに掲載されています。SNPと機能的ゲノム領域の距離感と関係を可視化するため、VaDEではUCSC Genome Browserを用いて独自のゲノムブラウザを開発しました。

ダウンロードファイル

「集団別再現SNP」ページと「全形質関連SNP」ページでは、画面右下の「CSV」「TSV」ボタンを押下することで表示中のデータをダウンロードすることができます。カラムの内容については別紙をご覧ください。

VaDEダウンロードファイルカラム説明書

リリースヒストリー

2016-9-20 VaDE version 1.7

データの内訳
カテゴリー種類レコード数データ元の論文数
疾患 554 11,176 1,188
形質 1,040 13,719 814
薬剤応答性 105 987 105
合計 1,699 25,882 2,107
データソースの内訳
データ種類レコード数説明
NHGRI-EBI GWAS catalog18,634 NHGRI-EBI GWAS catalogのダウンロードファイルから関連解析データを収集。詳細はNHGRI-EBI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。
NHGRI-EBI GWAS catalog (uncurated)5,867 NHGRI-EBI GWAS catalogのダウンロードファイルから関連解析データを収集。VaDEの表記ルールに合わせた形質名の修正およびサンプル人類集団の分類を行った。VaDEチームによる論文のキュレーションは行っていない。
VaDE1,381
  1. 1) p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。
  2. 2) Sato Nら(PMID:25069673)に基づく東京医科歯科大学から情報提供を受けた日本人における2型糖尿病の関連解析データを含む。

2016-1-20 VaDE version 1.6

2015-9-17 VaDE version 1.6

データの内訳
カテゴリー種類レコード数データ元の論文数
疾患 434 15,202 1,101
形質 877 10,066 673
薬剤応答性 84 753 87
合計 1,395 26,021 1,861
データソースの内訳
データ種類レコード数説明
NHGRI GWAS catalog18,494 p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。
VaDE7,527
  1. 1) p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。
  2. 2) Sato Nら(PMID:25069673)に基づく東京医科歯科大学から情報提供を受けた日本人における2型糖尿病の関連解析データを含む。

2015-6-16

2015-3-27 VaDE version 1.5

データの内訳
カテゴリー種類レコード数データ元の論文数
疾患 421 15,017 1,084
形質 872 9,949 671
薬剤応答性 83 752 85
合計 1,376 25,758 1,815
データソースの内訳
データ種類レコード数説明
NHGRI GWAS catalog18,231 p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。
VaDE7,527
  1. 1) p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。
  2. 2) Sato Nら(PMID:25069673)に基づく東京医科歯科大学から情報提供を受けた日本人における2型糖尿病の関連解析データを含む。

2014-12-16

2014-11-20 VaDE version 1.4

データの内訳
カテゴリー種類レコード数データ元の論文数
疾患 344 13,873 965
形質 455 8,118 648
薬剤応答性 64 588 68
その他 218 1,967 84
合計 1,081 24,546 1,722
データソースの内訳
データ種類レコード数説明
NHGRI GWAS catalog17,019 p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。
VaDE7,527
  1. 1) p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。
  2. 2) Sato Nら(PMID:25069673)に基づく東京医科歯科大学から情報提供を受けた日本人における2型糖尿病の関連解析データを含む。

2014-08-21 VaDE version 1.3

データソースの内訳
データ種類レコード数説明
NHGRI GWAS catalog15,283

p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。

VaDE7,530
  1. 1) p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。
  2. 2) Sato Nら(PMID:25069673)に基づく東京医科歯科大学から情報提供を受けた日本人における2型糖尿病の関連解析データを含む。

2014-06-26 VaDE version 1.2

データソースの内訳
データ種類レコード数説明
NHGRI GWAS catalog15,448

p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。

VaDE7,464

p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。

2014-06-06 VaDE version 1.1

2014-04-24 VaDE version 1.0

ご利用にあたって

免責条項

VarySysDB Disease Edition (VaDE)の情報はアカデミックな研究利用を目的として掲載しております。従って、当ウェブサイトに掲載されている情報に基づいて行われた診察・診断・ 治療・投薬を含む医療行為によって生じた損害、損失に対して一切の責任を負いません。

また、当サイトの情報には、細心の注意を払い可能な限り正確性を期しておりますが、あくまでも掲載時点における情報です。医療技術・ゲノム研究分野の進展によってウェブサイト上で掲載している情報が実際と一致しなくなる場合、論拠が薄弱になる場合、議論の余地が生じる場合があるため、その内容の正確性は保証できません。

VaDEデータベースの利用条件

本データベースのすべてのページは無償で自由に閲覧することができます。また、すべてのページに自由にリンクを張ることができます。しかし、全データをダウンロードして利用することは、アカデミックな研究および非営利目的の利用に限ります。全データについて営利目的での利用を希望される場合は、下記のコンタクトよりご連絡ください。

なお、本データベースはCreative Commonsに基づいて「表示 - 非営利 2.1 日本 (CC BY-NC 2.1 JP)」を設定しています。概要は以下の通りです。

より詳しくは、こちらのサイトをご参照下さい。

https://creativecommons.org/licenses/by-nc/2.1/jp/

著作権

本データベースの著作権は、東海大学医学部基礎医学系分子生命科学情報生物医学研究室に帰属しております。

引用文献

本データベースのデータを使用して論文などの著作物を出版する場合は、以下の論文を引用してください。

Nagai Y, Takahashi Y, and Imanishi T (2014) VaDE: a manually-curated database of reproducible associations between various traits and human genomic polymorphisms. Nucleic Acids Research, Database Issue 2014;doi:10.1093/nar/gku1037.

ABOUT US

VaDE開発チーム

東海大学 医学部基礎医学系 分子生命科学 情報生物医学研究室 (今西研究室)

  • 今西 規 教授
  • 羽原 拓哉 研究技術員
  • 間宮 健太郎 研究技術員
  • 世良 実穂 研究技術員

(過去のメンバー)

  • 長井 陽子 奨励研究員
  • 高橋 定子 研究技術員

発表

コンタクト

コメント、バグレポート、アイデアを受け付け中です。今後の改良に活かすため利用者の方々から広くご意見を募集しております。また、本データベースの開発にご協力いただける研究機関や民間企業を募集しています。下記のアドレス宛にご連絡をお願いいたします。

vade[@]ml.u-tokai.ac.jp

謝辞

東京医科歯科大学の佐藤憲子博士、Nay Chi Htun博士及び村松正明博士から2型糖尿病の関連解析データに関する情報提供を頂きました。学術文献からのマニュアルキュレーションにあたり、松井崇人博士、武田淳一博士、東海大学生命科学統合支援センターの皆様にご支援いただきました。沼倉健介博士には疾患の分類分け及び貴重な議論をしていただきました。ここに感謝いたします。

財源

本データベースは平成28年度科研費・研究成果公開促進費「データベース」(JSPS科研費、16HP8044)の助成を受けて開発されています。

クレジット

Icons: Font Awesome Created by Dave Gandy.

共同研究者の募集について

2015年2月20日
専門分野の研究者および民間企業の皆様へ

当研究室では、VaDEデータベースの構築のために多くの労力を費やしています。そこで、このデータベース構築にご協力いただける共同研究者・共同研究機関を募集しています。例えば、ご専門の疾患分野のデータ作成を分担していただければ、データベースをより早く更新できるようになります。また、民間企業からの共同研究のご提案も歓迎いたします。共同研究者には、VaDEの公開準備中の追加データを先行して提供させていただきます。ぜひご検討をお願い申し上げます。

連絡先:

疾患リスク情報データベース・プロジェクト(vade@ml.u-tokai.ac.jp

データ登録

VarySysDB Disease Edition (VaDE)データベースでは「再現性」のある疾患関連ゲノム多型の情報を提供していますので、今後データ量を増やすためには、新規の関連解析に加えて、再現性の有無を検証した研究成果を多く集めることが必要です。そこで、現在のVaDEに登録されていない研究成果(論文)がありましたら、ぜひ当方までお知らせください。ご協力をお願い申し上げます。

また、ご自身でデータを投稿できる仕組みもご用意しました。投稿用Excelフォーマットをこちらからダウンロードしてご記入の上、vade@ml.u-tokai.ac.jpまでお送りください。