TPリンク集 - データベース編 -
更新日:2011/09/27
1.配列から探る
代表的なタンパク質配列とその機能のデータベース.
タンパク質配列に自動的に機能アノテーションを加えたTrEMBL(2011年9月時点で1,688万件)と,そのデータを文献情報などを利用して吟味し高品質のアノテーションを付けたSwiss-Prot(同53万件)が公開されている.
Swiss-Protはアノテータ作業を要するため,最新の研究結果を反映していないことがある.
タンパク質配列に自動的に機能アノテーションを加えたTrEMBL(2011年9月時点で1,688万件)と,そのデータを文献情報などを利用して吟味し高品質のアノテーションを付けたSwiss-Prot(同53万件)が公開されている.
Swiss-Protはアノテータ作業を要するため,最新の研究結果を反映していないことがある.
実験的または配列解析(ホモロジーサーチとマルチプルアライメント)によって同定されたアミノ酸配列モチーフのタンパク質立体構造における位置を登録したもの.
PrositeとBLOCKSの2種類のアミノ酸配列モチーフデータベースと,タンパク質立体構造データベースPDBを用い,各エントリー中のモチーフ位置を決めている.
PrositeとBLOCKSの2種類のアミノ酸配列モチーフデータベースと,タンパク質立体構造データベースPDBを用い,各エントリー中のモチーフ位置を決めている.
全ゲノム配列が決まった生物種の全ORFのコードするタンパク質を,構造既知のタンパク質の立体構造に割り当てたデータベース.
立体構造予測には,多重媒介配列検索法(MISS法)を用いる.
2005年7月版で,234種のゲノムを収録.
立体構造予測には,多重媒介配列検索法(MISS法)を用いる.
2005年7月版で,234種のゲノムを収録.
遺伝子産物の機能を系統的に分類し,番号を付けたもの.
タンパク質の標準的な機能分類として使われている.
タンパク質の標準的な機能分類として使われている.
全ゲノム配列が決まった生物種の全ORFのコードするタンパク質の機能と立体構造予測結果をまとめたデータベース.
PDB, SCOP, Prosite, Pfamなどに加え,天然変性(ディスオーダー)領域の情報も提供.
2010年10月版で,1357種のゲノムを収録.
PDB, SCOP, Prosite, Pfamなどに加え,天然変性(ディスオーダー)領域の情報も提供.
2010年10月版で,1357種のゲノムを収録.
タンパク質の配列にアラインされるSCOP, CATH, Pfam, TIGRFAMs, Prosite, PRINTS, ProDom, SMARTなどのドメインを一括して表示するデータベース.
利用者が指定したタンパク質の配列についてPfam, TIGRFAMs, PRINTS, ProDom, SMARTなどを一括して検索し,表示する.
立体構造アラインメントは出来ず,データベースの選択によっては結果が出るまで長時間かかることがある.
立体構造アラインメントは出来ず,データベースの選択によっては結果が出るまで長時間かかることがある.
タンパク質の各機能が共通して持つ配列モチーフのデータベース.
広範囲の機能をカバーし(2011年3月時点で約12,273ファミリー),広く利用されている.
各機能を持つタンパク質群の配列を並べ,共通配列を抽出したのがPfamドメインであり,必ずしも立体構造のドメインではない.
専門家によるチェックを経ており高品質なPfam-Aと,PRODOMに登録されたファミリーから自動的に構築されたPfam-Bに分けられる.
InterProで検索されるデータベースの一つ.
広範囲の機能をカバーし(2011年3月時点で約12,273ファミリー),広く利用されている.
各機能を持つタンパク質群の配列を並べ,共通配列を抽出したのがPfamドメインであり,必ずしも立体構造のドメインではない.
専門家によるチェックを経ており高品質なPfam-Aと,PRODOMに登録されたファミリーから自動的に構築されたPfam-Bに分けられる.
InterProで検索されるデータベースの一つ.
それぞれのタンパク質ファミリーを特徴づける配列モチーフ群を集めたデータベース.
一つのモチーフより,モチーフ群(fingerprints)を用いた方が解像度が上がるとの考えに基づき,UniProtの配列から抽出している.
InterProで検索されるデータベースの一つ.
一つのモチーフより,モチーフ群(fingerprints)を用いた方が解像度が上がるとの考えに基づき,UniProtの配列から抽出している.
InterProで検索されるデータベースの一つ.
UniProtの配列データからタンパク質ファミリーを抽出し,そのドメイン構成を同定しているもの.
InterProで検索されるデータベースの一つ.
InterProで検索されるデータベースの一つ.
実験的裏付けのあるアミノ酸配列モチーフを集めたデータベース.
InterProで検索されるデータベースの一つ.
InterProで検索されるデータベースの一つ.
動く遺伝因子のドメインとドメイン構成を同定し,アノテーションを加えたもの.
シグナリング・細胞外タンパク質やクロマチン結合タンパク質のファミリーをカバー.
シグナリング・細胞外タンパク質やクロマチン結合タンパク質のファミリーをカバー.
TIGR (The Institute for Genome Research)が構築し,JCVIが引き継いだタンパク質ファミリーのデータベース.
隠れマルコフモデルを用いてタンパクをファミリー分類したもの.
Pfamと補完性あり.
隠れマルコフモデルを用いてタンパクをファミリー分類したもの.
Pfamと補完性あり.
全ゲノム配列が決定した生物種のゲノム中に含まれるβ-バレル型膜タンパク質のデータベース.
各ゲノム配列に対して,機械学習と統計手法を用いた計算が実行され,アノテーション結果がデータベースに格納されている.
アミノ酸配列を入力してβ-バレル型膜タンパク質の判別解析を行うツールも提供.
各ゲノム配列に対して,機械学習と統計手法を用いた計算が実行され,アノテーション結果がデータベースに格納されている.
アミノ酸配列を入力してβ-バレル型膜タンパク質の判別解析を行うツールも提供.
2.構造を探る
既知のタンパク質立体構造を半自動的に分類しているデータベース.
SCOPと並んで,代表的な立体構造分類法.
SCOPと並んで,代表的な立体構造分類法.
電子顕微鏡データ(日本): 生体分子や生体組織の3次元電子顕微鏡データを,気軽に楽しく眺めるためのウェブサイト.
PDBjがEMDB と PDB のデータを利用して運営.
統計情報分子・構造生物学の専門家にも,初心者や専門外の人にも楽しめるサイトを目指している.
PDBjがEMDB と PDB のデータを利用して運営.
統計情報分子・構造生物学の専門家にも,初心者や専門外の人にも楽しめるサイトを目指している.
巨大分子複合体や細胞内構造の電子顕微鏡密度マップの登録を受け,提供している電子顕微鏡データバンク.
低温電子顕微鏡により決定された立体構造は,このサイトとPDBに一括登録可能.
単粒子解析法,電子線トモグラフィー,2次元結晶法などのデータを含む.
低温電子顕微鏡により決定された立体構造は,このサイトとPDBに一括登録可能.
単粒子解析法,電子線トモグラフィー,2次元結晶法などのデータを含む.
酵素立体構造情報,文献情報などに基づいて,酵素触媒機構を階層的に分類しているデータベース.
各酵素エントリーには,酵素番号(EC number),PDBエントリー,触媒部位,リガンド情報や文献情報,触媒機構に関する情報,他のデータベース(Swiss-Prot, CATH, KEGG, PDBsum, PubMed, CSA & MACiE)へのリンクが張られている.
735エントリーを収録(2010年12月).
各酵素エントリーには,酵素番号(EC number),PDBエントリー,触媒部位,リガンド情報や文献情報,触媒機構に関する情報,他のデータベース(Swiss-Prot, CATH, KEGG, PDBsum, PubMed, CSA & MACiE)へのリンクが張られている.
735エントリーを収録(2010年12月).
PDBに登録されたNMR構造をクラスタリングし,代表構造とサブファミリーに分類して公開しているデータベース.
PDBのIDにより検索する.
PDBのIDにより検索する.
PDBに登録されたタンパク質の立体構造を示し,機能・文献その他の関連情報を示す.
特定のPDB構造に関する情報を得るのに有用.
特定のPDB構造に関する情報を得るのに有用.
変異体を含むタンパク質の熱力学データベース.
変性温度,変性自由エネルギー,実験条件,実験方法などを文献から集めている,類例のないデータベースである.
変性温度,変性自由エネルギー,実験条件,実験方法などを文献から集めている,類例のないデータベースである.
既知のタンパク質立体構造を専門家の手で進化的に最小と考えられるユニットに分け,分類しているデータベース.
CATHと並んで,最もよく使われる立体構造分類.
アップデートが頻繁ではないため,PDBに登録された構造でもカバーされていないものがある.
CATHと並んで,最もよく使われる立体構造分類.
アップデートが頻繁ではないため,PDBに登録された構造でもカバーされていないものがある.
7本膜貫通ヘリックス型タンパク質のGPCR遺伝子を網羅的に収めたデータベース.
56の真核生物のゲノムからバイオインフォマティクス手法で,GPCR遺伝子を高精度に同定している.
56の真核生物のゲノムからバイオインフォマティクス手法で,GPCR遺伝子を高精度に同定している.
立体構造が明らかになった膜タンパク質に関するデータベース.
酵素のデータベース.
EC番号で分類されており,化学反応式も見ることができる.
EC番号で分類されており,化学反応式も見ることができる.
実験計画の立案に利用可能なX線異常散乱データベース.
3.技術を探す
生命科学系の実験に関するプロコールのリンク集.
Proteinで検索すると,Extraction & Purification, Diaysis, Crystallization, Expressionなどのカテゴリが表示される.
Proteinで検索すると,Extraction & Purification, Diaysis, Crystallization, Expressionなどのカテゴリが表示される.
蛋白質科学会内の日本語のページであり,タンパク質実験技術に関する記事を集めたもの.
実験のコツなどが解りやすく記述されている.
実験のコツなどが解りやすく記述されている.
タンパク質結晶凍結のために必要な試薬条件のデータベース.
播磨理研におけるタンパク3000プロジェクト時の発現,精製,結晶化,回折データ測定等の実験データをまるまるデータベース化.
ロボットによる結晶化の観察画像なども全て公開.
(ただし微生物由来のタンパク質限定)
ロボットによる結晶化の観察画像なども全て公開.
(ただし微生物由来のタンパク質限定)
4.その他の生体高分子は
産総研での糖鎖関連データベースを集約.
以下の7つのデータベースの横断検索が可能.
以下の7つのデータベースの横断検索が可能.
糖鎖関連遺伝子データベース
レクチンおよびそれらのピリジルアミノ化糖鎖との相互作用情報データベース
糖タンパク質データベース.
現在は,線虫およびマウスの組織より採取した糖タンパク質の情報を収録.
現在は,線虫およびマウスの組織より採取した糖タンパク質の情報を収録.
糖鎖そのものの構造情報に有用な質量分析データ.
MS1-MS4程度まで収録.
MS1-MS4程度まで収録.
糖鎖抗原(糖鎖エピトープ)を発現する糖タンパク質,糖鎖エピトープを部分構造とする糖脂質,エピトープの合成や分解に関与する生合成酵素および分解酵素,糖鎖エピトープの発現の時期・場所,糖鎖エピトープの関連する疾病,糖鎖認識抗体の入手先などの情報を収録.
糖鎖構造解析を2-D/3-D 糖鎖マッピング法によって行うためのデータベース
各種脂質(脂肪酸,グリセロ脂質,sphingolipds, ステロイド,ビタミンなど)のデータベース.
構造情報や文献情報,NMRやMSの測定スペクトルなどの情報を含む.
構造情報や文献情報,NMRやMSの測定スペクトルなどの情報を含む.
実験的に確かめられた糖鎖そのものの構造のデータベース
糖鎖に関連する機能データベース.
検索結果が二項関係として表示される.
検索結果が二項関係として表示される.
Glycosidase や糖転移酵素の情報を集約.
各種生物由来のレクチンのデータベース.
検索機能は無いが,分類から手動で探す.
各エントリには立体構造が表示される.
検索機能は無いが,分類から手動で探す.
各エントリには立体構造が表示される.
Glycan database (mw などで検索), GBP (Glycan Binding Proteins) database (分類から選択), Glyco Enzymes (糖転移酵素を糖の構造の各部分から検索).
ヒトに特化した代謝物データベース.
質量分析による代謝物データベース.
様々なRNAの配列情報とRNA修飾酵素に関するデータベース.最近はページの更新をしていなさそう.
5.低分子を巡る
2004年にスタートした,NIH ロードマップに基づく化合物とその生体活性の網羅的収集.
30million compounds/85million substances/500,000 bioassays (2011.08現在)
30million compounds/85million substances/500,000 bioassays (2011.08現在)
スクリーニング生データの収集,スクリーニング条件の厳密な記述,メタデータに基づくDB.
バーチャルスクリーニングのための市販化合物3次元構造DBと フリードッキングソフトDOCKの提供.
EBI開発の化合物辞書.
2次元,3次元構造表示,生理活性の分類,応用可能性などの記述.
2次元,3次元構造表示,生理活性の分類,応用可能性などの記述.
EBIが提供するDrug-likeな生物活性低分子のデータベース.構造式,化合物プロパティ,生物活性情報を提供している.
データは,学術論文から抽出及びキュレーションされ,最新のSAR及び創薬情報のかなりの部分をカバーしている.
データは,学術論文から抽出及びキュレーションされ,最新のSAR及び創薬情報のかなりの部分をカバーしている.
バイアスなしに化合物−遺伝子/タンパク質−疾患の関係を文献からマニュアルキュレートしたデータベース.
2011年2月現在302,209件の化合物−遺伝子/タンパク質相互作用情報が格納.
2011年2月現在302,209件の化合物−遺伝子/タンパク質相互作用情報が格納.
公開されている化学構造DBにアクセスできるウェブサービス.
化合物2次元構造DB,購入可能な450万件.
化合物3次元構造DB,289万化合物.
化合物,薬剤,糖類,酵素,生化学反応などのデータからなるKEGGのサブDB.
薬剤(6,800エントリー)とそのターゲットタンパクデータ集,ターゲット配列,構造,パスウェイ.
2400の市販薬活性成分の3次元構造DB.
薬剤のターゲット,薬効,副作用,代謝経路などの情報を纏めたDB.
約10万件の天然物に関するDB.
薬剤,ジェノタイプ,フェノタイプ,PK/PD,臨床情報の情報を纏めたDB.
Protein Data Bank(PDB)にある化合物情報を纏めたDB.
化合物とタンパク質の相互作用ネットワークにつき各種DBならびに文献をキュレートしたDB.
もっとも重要な薬剤ターゲットであるGPCRとリガンドにつき,ケモジェノミクスの視点で纏めたDB.
結晶構造精密化を行うときにCNSソフトで役立つ低分子化合物のトポロジー・パラメータDB.
小分子の立体構造を見ることができ,さまざまなソフトウェア用のトポロジーファイルを作成する.
入力は,PDB形式の座標,MDL MOLfileまたはテキストエディターで描いた構造図.
出力は,GROMOS, GROMACS, WHAT IF, REFMAC5, CNS, O, SHELX, HEXまたはMOL2のデータ形式に変換.水素原子の座標も生成する.
入力は,PDB形式の座標,MDL MOLfileまたはテキストエディターで描いた構造図.
出力は,GROMOS, GROMACS, WHAT IF, REFMAC5, CNS, O, SHELX, HEXまたはMOL2のデータ形式に変換.水素原子の座標も生成する.
6.相互作用を探る
ヘテロダイマーの界面にアラニン変異を導入した際に,どれだけ相互作用エネルギーが変化するかを測定した実験結果を集めたデータベース.
2009年6月上旬現在,3043個の変異結果が収められている.
データベースMySQL dump でダウンロードできる.
2009年6月上旬現在,3043個の変異結果が収められている.
データベースMySQL dump でダウンロードできる.
大腸菌でわかっている「機能的相互作用」と「タンパク質間相互作用」のデータベース.
タンパク質間相互作用のデータは,データの質が高い「コア」ネットワークと,相互作用の証拠がやや薄い「拡張」ネットワークの2種類に分類されている.
2009年6月上旬現在,機能的相互作用は1941個の遺伝子由来の3989個の相互作用が,コアネットワークには918遺伝子由来の3888個の相互作用が,拡張ネットワークには2291遺伝子由来の7220個の相互作用が含まれている.
タンパク質間相互作用のデータは,データの質が高い「コア」ネットワークと,相互作用の証拠がやや薄い「拡張」ネットワークの2種類に分類されている.
2009年6月上旬現在,機能的相互作用は1941個の遺伝子由来の3989個の相互作用が,コアネットワークには918遺伝子由来の3888個の相互作用が,拡張ネットワークには2291遺伝子由来の7220個の相互作用が含まれている.
原核生物,動物,植物の22生物種で実験的に明らかになっている,タンパク質の物理的相互作用と遺伝的相互作用を集めたデータベース.
総計24万個近いデータを整理している.データベース内に登場するタンパク質は52万個以上.
データがフラットファイルでダウンロードできる.
総計24万個近いデータを整理している.データベース内に登場するタンパク質は52万個以上.
データがフラットファイルでダウンロードできる.
立体構造が明らかになっているタンパク質の生物学的に意味があると想定される相互作用集.
タンパク質相互作用界面がかなり複雑な構造(平らではなくからまりあっている場合が多いこと)をグラフィックスをつかって示している.
タンパク質相互作用界面がかなり複雑な構造(平らではなくからまりあっている場合が多いこと)をグラフィックスをつかって示している.
ヒトの手によってチェックされている,タンパク質間相互作用実験データを集積したデータベース.
ヒト,マウス,ショウジョウバエ,酵母,大腸菌など10生物種でなされた6万個以上の実験データを整理して,2万個強のタンパク質が関与する7万個程度の相互作用を蓄積している.
ヒト,マウス,ショウジョウバエ,酵母,大腸菌など10生物種でなされた6万個以上の実験データを整理して,2万個強のタンパク質が関与する7万個程度の相互作用を蓄積している.
ショウジョウバエの遺伝子相互作用とタンパク質相互作用を集積したデータベース.
酵母2ハイブリッドなどの実験により明らかになっている相互作用(約3万相互作用)と,他生物種で明らかになっている相互作用からの推定(約13万相互作用)の両方が含まれている.
酵母2ハイブリッドなどの実験により明らかになっている相互作用(約3万相互作用)と,他生物種で明らかになっている相互作用からの推定(約13万相互作用)の両方が含まれている.
ヒトのガンに関与するタンパク質の相互作用データを集積したデータベース.
パスウェイを7つに限り(apoptosis, cell-cycle, JAK, MAPK, PI3K, TGF, TLR),そのパスウェイに関与する相互作用を徹底的に集めている.
パスウェイを7つに限り(apoptosis, cell-cycle, JAK, MAPK, PI3K, TGF, TLR),そのパスウェイに関与する相互作用を徹底的に集めている.
ヒトのタンパク質相互作用に限って,BIND, DIP, HPRDからデータを集めて整理したデータベース.
生化学的な実験または構造解析によって明らかになっている相互作用のみが含まれている.
ユーザが提示するタンパク質の相互作用相手をデータベースから簡単に紹介してくれる.
生化学的な実験または構造解析によって明らかになっている相互作用のみが含まれている.
ユーザが提示するタンパク質の相互作用相手をデータベースから簡単に紹介してくれる.
ヒトタンパク質の統合データベース.この中にタンパク質の相互作用情報が39千件以上含まれている.
商用使用にはデータベース開発元の許可が必要.
商用使用にはデータベース開発元の許可が必要.
かずさcDNAプロジェクトにおいて明らかになった,ヒト巨大タンパク質の相互作用のデータベース.
酵母2ハイブリッド法による結果が集積されている.
酵母2ハイブリッド法による結果が集積されている.
EBIが提供するタンパク質相互作用のデータベースと解析ツール.データは論文から収集あるいはデータベースへの登録による.
2011年1月の時点で12,715 の実験,54,024 のタンパク質,272,410 の1対1相互作用, 1,643の統制語が登録されている.
2011年1月の時点で12,715 の実験,54,024 のタンパク質,272,410 の1対1相互作用, 1,643の統制語が登録されている.
325種類のサイトを蛋白間相互作用,代謝経路,シグナル伝達系,転写因子/遺伝子調節,蛋白化合物相互作用,遺伝子間相互作用などのカテゴリーに分類した網羅的ディレクトリ.
各種標準(PSI-MI,BioPAX, SBML, CellML)への対応状況も含まれる.
また,Googleによる人気順によるリストの並べ替えも可能.
各種標準(PSI-MI,BioPAX, SBML, CellML)への対応状況も含まれる.
また,Googleによる人気順によるリストの並べ替えも可能.
ヒトタンパク質の相互作用予測結果のデータベース.他生物種でわかっている全相互作用をもとにヒトホモローグの相互作用を推定.
特にタンパク質のリン酸化による相互作用の変化を気にしたデータベース.
特にタンパク質のリン酸化による相互作用の変化を気にしたデータベース.
タンパク質・核酸相互作用データベース.
相互作用に関する実験データを文献から収集し,データベース化したもの.
10,888件収録(2010年12月).
相互作用に関する実験データを文献から収集し,データベース化したもの.
10,888件収録(2010年12月).
理化学研究所において明らかになったマウスのタンパク質相互作用の表.
2001年に発表した論文のSupplementary.
145件の相互作用が記載されている.
2001年に発表した論文のSupplementary.
145件の相互作用が記載されている.
630生物種で観測または予測されたタンパク質間の物理的相互作用と機能的相互作用のすべてを含むデータベース.
250万個以上のタンパク質に関する情報が含まれている.
遺伝子のオペロン構造などによる予測にもとづく相互作用,ハイスループット実験結果,マイクロアレーでわかる共発現のうちよく保存されているもの,および様々なデータベースの記述からの情報をもとにしている.
250万個以上のタンパク質に関する情報が含まれている.
遺伝子のオペロン構造などによる予測にもとづく相互作用,ハイスループット実験結果,マイクロアレーでわかる共発現のうちよく保存されているもの,および様々なデータベースの記述からの情報をもとにしている.