VaDEとは
VaDE 概要
VarySysDB Disease Edition(VaDE)データベースは、さまざまな疾患へのかかりやすさや薬剤応答性などの形質に関わるヒトゲノム多型の情報を、多数の学術論文から収集したデータベースです。
VaDEデータベースに格納されているデータは、主にヒトの疾患や薬剤応答性に関わるゲノム多型です。そのほか、身長や体重などの一般的形質に関わるゲノム多型も多数含まれます。これらの多型について、オッズ比やβ値、研究対象の集団、P値などの豊富な情報を提供しています。さらに、複数の独立な研究における再現性の有無を評価しています。
VaDEデータベースを使うことにより、信頼性の高い疾患感受性ゲノム多型の情報を容易に検索して取得できます。この情報は、個人のゲノム情報と照らし合わせることにより個人の疾患感受性を予測する研究に使うことができ、将来の予防医療への応用が期待されます。このほか創薬や法医学、人類学など幅広い分野に利用可能であり、本データベースの役割は今後ますます重要になることが期待されます。
各種ページの詳細情報および利用手順
VaDEデータベース利用手順書をご参照ください。
データベース構築
データベース構築詳細
SNP-形質関連解析データ
VaDE のSNP-形質関連解析データは1. The NHGRI-EBI Catalog of published genome-wide association studies (NHGRI-EBI GWAS catalog) http://www.ebi.ac.uk/gwas/由来のデータ、及び2. VaDE独自のデータから成り立っています。
1. NHGRI-EBI GWAS catalogに掲載されたデータを再マニュアルキュレーションし、データの確認及び追加・修正・フォーマットの変更作業を行っております。2. VaDEチームによる網羅的なマニュアルキュレーションが現在進行中です。外部から提供されたデータに関しても、VaDEチームによる確認プロセスを経て、内部に取り込んでいます。個々のデータの詳細に関しては下記のリリースヒストリーをご参照ください。
なお、関連解析結果は様々な遺伝的モデルが利用されていますが、VaDEではアレリックモデルとアディティブモデルに統一し、劣性モデル、優性モデルの結果を除外しています。
人類集団、疾患名、遺伝子オントロジーの標準化
VaDEでは各関連解析結果に加え、それぞれの研究で用いられたサンプルの人類集団(祖先)、民族及び国籍の情報を提供しています。国名と人類集団の用語はthe World Factbook of CIAとComposition of regions of United Nations Statistics Divisionを参考に標準化しています。
サンプルの人類集団情報は以下の11の集団に分類されます。
- ヨーロッパ人(ヨーロッパ系アメリカ人、ヨーロッパ系オーストラリア人、ヨーロッパ系ニュージーランド人、西ヨーロッパ人、北ヨーロッパ人、南ヨーロッパ人、東ヨーロッパ人などを含む)
- アフリカ人(アフリカ系アメリカ人などを含む)
- 東アジア人
- 東南アジア人
- 南アジア人
- 中央アジア人
- 中東人
- カリブ人/中米人(ラテン、ヒスパニック、カリブ系ヒスパニックなどを含む)
- 北アメリカ人(ネイティブアメリカン、ネイティブアラスカンなどを含む)
- 南アメリカ人
- オセアニア人
形質や疾患は疾患、一般的形質、ファーマコゲノミクスの3つのカテゴリーに分類されます。また、全ての疾患はUnified Medical Language System (UMLS)を用いた機械的紐づけとマニュアルキュレーションにより国際疾病分類第10版(ICD-10)の分類が適用されています。SNP座標はdbSNP137に基づいています。報告遺伝子はオリジナル論文に報告されている遺伝子です。
再現性の評価
SNP-形質関連解析の再現性の評価には、統計的に有意(GWAS: P値 ≤ 1.0 × 10-5、replication study: P値 ≤ 0.05)であり、かつ単一の人類集団によるデータを用いて検証しています。
2段階研究など、同じ論文内で独立した集団を用いた研究が複数回実施されている場合、それぞれの関連解析結果が得られるまでに用いられた各段階ごとの研究のうち統計的に有意な研究数を全てカウントしています。ついで、人類集団、形質、SNPリスクアレルの組み合わせごとに、独立した論文間での統計的に有意な研究数の合計を取得し、再現性を検証しています。論文内及び論文間の独立した研究によって再現性が認められたSNP-形質関連解析は「集団別再現SNP」のページより提供しています。
機能的ゲノム領域のデータ
ENCODEプロジェクトによる、ChIP-seq、DNase I高感受性領域、制御モチーフなどの実験データ、ENCODE/BroadおよびNIH Roadmap Epigenomics Mapping Consortiumによるクロマチン状態セグメントデータ、RefSeq遺伝子アノテーションデータはHaploreg v2よりダウンロードしました。SNPに対するH-InvDB転写産物のアノテーションデータはVarySysDBより取得しました。1000 Genomes Projectに基づくSNPの上流下流3000SNPsの連鎖不平衡(LD)係数は、Center for Statistical Genetics、University of Michiganにより提供されています。詳細な解析方法はhttp://www.sph.umich.edu/csg/abecasis/MACH/download/1000G.2012-02-14.htmlに掲載されています。SNPと機能的ゲノム領域の距離感と関係を可視化するため、VaDEではUCSC Genome Browserを用いて独自のゲノムブラウザを開発しました。
ダウンロードファイル
「集団別再現SNP」ページと「全形質関連SNP」ページでは、画面右下の「CSV」「TSV」ボタンを押下することで表示中のデータをダウンロードすることができます。カラムの内容については別紙をご覧ください。
リリースヒストリー
2016-9-20 VaDE version 1.7
- データアップデート: NHGRI-EBI GWAS catalog 2015.4.11-2016.4.28までの更新データの追加
- データアップデート: 形質/疾患リストの更新
カテゴリー | 種類 | レコード数 | データ元の論文数 |
---|---|---|---|
疾患 | 554 | 11,176 | 1,188 |
形質 | 1,040 | 13,719 | 814 |
薬剤応答性 | 105 | 987 | 105 |
合計 | 1,699 | 25,882 | 2,107 |
データ種類 | レコード数 | 説明 |
---|---|---|
NHGRI-EBI GWAS catalog | 18,634 | NHGRI-EBI GWAS catalogのダウンロードファイルから関連解析データを収集。詳細はNHGRI-EBI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。 |
NHGRI-EBI GWAS catalog (uncurated) | 5,867 | NHGRI-EBI GWAS catalogのダウンロードファイルから関連解析データを収集。VaDEの表記ルールに合わせた形質名の修正およびサンプル人類集団の分類を行った。VaDEチームによる論文のキュレーションは行っていない。 |
VaDE | 1,381 |
|
2016-1-20 VaDE version 1.6
- 機能拡張: サイト内検索機能を追加
2015-9-17 VaDE version 1.6
- データアップデート: NHGRI GWAS catalog 2014.12.16-2015.4.10までの更新データの追加
- データアップデート: 形質/疾患リストの更新
- 機能拡張: 複数の疾患や形質を同時に検索するための検索機能の追加
- 機能拡張: 各データのURLの変更
カテゴリー | 種類 | レコード数 | データ元の論文数 |
---|---|---|---|
疾患 | 434 | 15,202 | 1,101 |
形質 | 877 | 10,066 | 673 |
薬剤応答性 | 84 | 753 | 87 |
合計 | 1,395 | 26,021 | 1,861 |
データ種類 | レコード数 | 説明 |
---|---|---|
NHGRI GWAS catalog | 18,494 | p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。 |
VaDE | 7,527 |
|
2015-6-16
- 機能拡張: 形質/疾患検索における対象キーワードの拡充 (例: cancer)
- バグ修正: データ処理の一部不具合の修正
2015-3-27 VaDE version 1.5
- データアップデート: NHGRI GWAS catalog 2014.8.9-12.15までの更新データの追加
- データアップデート:既存データの一部修正
- データアップデート: 形質/疾患リストの更新
- バグ修正: 形質/疾患リストの機能の一部不具合の修正
カテゴリー | 種類 | レコード数 | データ元の論文数 |
---|---|---|---|
疾患 | 421 | 15,017 | 1,084 |
形質 | 872 | 9,949 | 671 |
薬剤応答性 | 83 | 752 | 85 |
合計 | 1,376 | 25,758 | 1,815 |
データ種類 | レコード数 | 説明 |
---|---|---|
NHGRI GWAS catalog | 18,231 | p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。 |
VaDE | 7,527 |
|
2014-12-16
- 機能拡張: 集団別再現SNPページでの国名検索機能の追加
- バグ修正: データ処理の一部不具合の修正
2014-11-20 VaDE version 1.4
- データアップデート: NHGRI GWAS catalog 2014.1.21-8.8までの更新データの追加
- 機能拡張: 多段階研究における段階ごとの詳細なサンプル情報の追加
- バグ修正: ダウンロード機能の一部不具合の修正
カテゴリー | 種類 | レコード数 | データ元の論文数 |
---|---|---|---|
疾患 | 344 | 13,873 | 965 |
形質 | 455 | 8,118 | 648 |
薬剤応答性 | 64 | 588 | 68 |
その他 | 218 | 1,967 | 84 |
合計 | 1,081 | 24,546 | 1,722 |
データ種類 | レコード数 | 説明 |
---|---|---|
NHGRI GWAS catalog | 17,019 | p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。 |
VaDE | 7,527 |
|
2014-08-21 VaDE version 1.3
- データアップデート:2型糖尿病データの追加
- データアップデート:論文ごとに統計的に有意な研究数をカウント
- 機能拡張:統計的に有意な研究数に基づく再現性評価の見直し
データ種類 | レコード数 | 説明 |
---|---|---|
NHGRI GWAS catalog | 15,283 | p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。 |
VaDE | 7,530 |
|
2014-06-26 VaDE version 1.2
- ゲノムブラウザと日本語対応ページの公開
- データアップデート:関節リウマチおよび高血圧のマニュアルキュレーションデータを追加
- 機½拡張:レコードクリックによる詳細情報の表示、キーワード入力検索システム、形質のカテゴリー検索システム、内部リンクの充実
- バグ修正:外部リンクURLの修正
データ種類 | レコード数 | 説明 |
---|---|---|
NHGRI GWAS catalog | 15,448 | p値が1E-5以下の相関解析データに限定。詳細はNHGRI GWAS catalogのウェブサイトを参照。VaDEチームにてサンプルの人類集団、国籍、民族情報を追加。VaDEチームがキュレーションした関連解析データと重複するデータは除外。 |
VaDE | 7,464 | p値に関係なくオリジナル論文に掲載された全ての相関解析データを収集。高血圧と関節リウマチの関連解析データを含む。 |
2014-06-06 VaDE version 1.1
- bmi-tokai.jpドメイン名の利用開始
2014-04-24 VaDE version 1.0
- VaDEデータベースの試験公開
ご利用にあたって
免責条項
VarySysDB Disease Edition (VaDE)の情報はアカデミックな研究利用を目的として掲載しております。従って、当ウェブサイトに掲載されている情報に基づいて行われた診察・診断・ 治療・投薬を含む医療行為によって生じた損害、損失に対して一切の責任を負いません。
また、当サイトの情報には、細心の注意を払い可能な限り正確性を期しておりますが、あくまでも掲載時点における情報です。医療技術・ゲノム研究分野の進展によってウェブサイト上で掲載している情報が実際と一致しなくなる場合、論拠が薄弱になる場合、議論の余地が生じる場合があるため、その内容の正確性は保証できません。
VaDEデータベースの利用条件
本データベースのすべてのページは無償で自由に閲覧することができます。また、すべてのページに自由にリンクを張ることができます。しかし、全データをダウンロードして利用することは、アカデミックな研究および非営利目的の利用に限ります。全データについて営利目的での利用を希望される場合は、下記のコンタクトよりご連絡ください。
なお、本データベースはCreative Commonsに基づいて「表示 - 非営利 2.1 日本 (CC BY-NC 2.1 JP)」を設定しています。概要は以下の通りです。
あなたは以下の条件に従う限り、自由に:
- 共有 -
- どのようなメディアやフォーマットでも資料を複製したり、再配布できます。
- 翻案 -
- 資料をリミックスしたり、改変したり、別の作品のベースにしたりできます
あなたがライセンスの条件に従っている限り、許諾者がこれらの自由を取り消すことはできません。
あなたの従うべき条件は以下の通りです。
- 表示 -
- あなたは 適切なクレジットを表示し、ライセンスへのリンクを提供し、変更があったらその旨を示さなければなりません。あなたはこれらを合理的などのような方法で行っても構いませんが、許諾者があなたやあなたの利用行為を支持していると示唆するような方法は除きます。
- 非営利 -
- あなたは営利目的でこの資料を利用してはなりません。
より詳しくは、こちらのサイトをご参照下さい。
https://creativecommons.org/licenses/by-nc/2.1/jp/
著作権
本データベースの著作権は、東海大学医学部基礎医学系分子生命科学情報生物医学研究室に帰属しております。
引用文献
本データベースのデータを使用して論文などの著作物を出版する場合は、以下の論文を引用してください。
Nagai Y, Takahashi Y, and Imanishi T (2014) VaDE: a manually-curated database of reproducible associations between various traits and human genomic polymorphisms. Nucleic Acids Research, Database Issue 2014;doi:10.1093/nar/gku1037.
ABOUT US
VaDE開発チーム
東海大学 医学部基礎医学系 分子生命科学 情報生物医学研究室 (今西研究室)
- 今西 規 教授
- 羽原 拓哉 研究技術員
- 間宮 健太郎 研究技術員
- 世良 実穂 研究技術員
(過去のメンバー)
- 長井 陽子 奨励研究員
- 高橋 定子 研究技術員
発表
- Nagai Y, Takahashi Y, and Imanishi T (2014) VaDE: a manually-curated database of reproducible associations between various traits and human genomic polymorphisms. Nucleic Acids Research, Database Issue 2014;doi:10.1093/nar/gku1037.
- Y. Nagai, Y. Takahashi, T. Imanishi. DATABASE OF DISEASE-ASSOCIATED GENOMIC POLYMORPHISMS CONFIRMED IN INDEPENDENT STUDIES. HGM2014
- T. Imanishi, Y. Nagai, Y. Takahashi. Database of disease-associated genomic polymorphisms based on assessment of reproducibility between or within human populations. ASHG2014 Annual Meeting
コンタクト
コメント、バグレポート、アイデアを受け付け中です。今後の改良に活かすため利用者の方々から広くご意見を募集しております。また、本データベースの開発にご協力いただける研究機関や民間企業を募集しています。下記のアドレス宛にご連絡をお願いいたします。
謝辞
東京医科歯科大学の佐藤憲子博士、Nay Chi Htun博士及び村松正明博士から2型糖尿病の関連解析データに関する情報提供を頂きました。学術文献からのマニュアルキュレーションにあたり、松井崇人博士、武田淳一博士、東海大学生命科学統合支援センターの皆様にご支援いただきました。沼倉健介博士には疾患の分類分け及び貴重な議論をしていただきました。ここに感謝いたします。
財源
本データベースは平成28年度科研費・研究成果公開促進費「データベース」(JSPS科研費、16HP8044)の助成を受けて開発されています。
クレジット
Icons: Font Awesome Created by Dave Gandy.
共同研究者の募集について
2015年2月20日
専門分野の研究者および民間企業の皆様へ
当研究室では、VaDEデータベースの構築のために多くの労力を費やしています。そこで、このデータベース構築にご協力いただける共同研究者・共同研究機関を募集しています。例えば、ご専門の疾患分野のデータ作成を分担していただければ、データベースをより早く更新できるようになります。また、民間企業からの共同研究のご提案も歓迎いたします。共同研究者には、VaDEの公開準備中の追加データを先行して提供させていただきます。ぜひご検討をお願い申し上げます。
連絡先:
疾患リスク情報データベース・プロジェクト(vade@ml.u-tokai.ac.jp)データ登録
VarySysDB Disease Edition (VaDE)データベースでは「再現性」のある疾患関連ゲノム多型の情報を提供していますので、今後データ量を増やすためには、新規の関連解析に加えて、再現性の有無を検証した研究成果を多く集めることが必要です。そこで、現在のVaDEに登録されていない研究成果(論文)がありましたら、ぜひ当方までお知らせください。ご協力をお願い申し上げます。
また、ご自身でデータを投稿できる仕組みもご用意しました。投稿用Excelフォーマットをこちらからダウンロードしてご記入の上、vade@ml.u-tokai.ac.jpまでお送りください。