戻る

4-2. タンパク質立体構造分類データベース:CATH、SCOP

■ タンパク質立体構造分類データベース

タンパク質そのもの、つまりアミノ酸配列は、全体で約10万種類以上あるとも言われていますが、 タンパク質を構成する基本立体構造は、約1万種類程度しかないと考えられています。 この立体構造に着目し、階層的に分類、比較を行っているデータベースが SCOPCATH です。 このような構造分類は、タンパク質の機能を予測・解析するのに非常に重要です。

それぞれのサイトへはPDB のリンクからジャンプすることができます。

CATH Protein Structure Classification

University College London で構築されたデータベースです。 タンパク質の立体構造をプログラムによりドメイン単位に分割し、 分割されたドメイン構造をプログラムおよび人の目で分類しています。
図は、CATH で定義されている階層を表しています。

  1. Class (C):二次構造のタイプにより Mainly Alpha、Mainly Beta、Mixed Alpha-Beta、Few Secondary Structures の4種類に分類
  2. Architecture (A):二次構造の相対的な配置が類似しているもの
  3. Topology (T):二次構造の相対的な配置とつながり方が類似しているもの
  4. Homologous Superfamily (H):共通の進化的起源をもっていると予想されるもの
  • PDB からのアクセス

  • Structural Neighbors のトップにある CATH をクリック。 PDB3VHB という ID で登録されている2つの分子がリストされます。



    ここで、Domain という項目の文字をクリックすると、 その分子に関する CATH における登録情報が表示されます。 立体構造および配列により詳細に分類されています。



    数字は、各階層(Level)での分類を表しています。 Class の右の 1 をクリックすると Class1(Mainly Alpha) に存在する 5つの Architecture レベルがリストで表示されます。



SCOP(Structural Classification of Proteins)

英国 MRC Laboratory of Molecular Biology により構築されたデータベース。
タンパク質の立体構造を目で比較し、手動で分類しています。次の階層により分類されています。
  1. Class:主に二次構造のタイプにより All α、All β、α/β、α+β、マルチドメインタンパク質、膜タンパク質、小さなタンパク質、コイルドコイル、低解像度、ペプチド、デザインされたタンパク質に分類
  2. Fold:立体構造のみが類似
  3. Superfamily:アミノ酸配列の相同性は低いが、立体構造および機能が類似
  4. Families:アミノ酸配列の相同性が高いグループ
"Bacterial Hemoglobin""Heme-binding protein" といった情報も見ることができ、 CATH よりも機能に関する情報を得やすい。



OLIGAMI(Oligomer Architecture and Molecular Interface)

4次構造情報とSCOPを組み合わせたデータベース。
4次構造情報にすばやくアクセスできます。

【演習 3】
1IER、1AJ9、1MXS

これらのタンパク質の立体構造がどのような立体構造分類に属しているのか、何量体なのか調べよう。


[ 演習 4 ]
演習 1-1 で調べた遺伝子 AB028630 の 2 つ目のタンパク質と配列と最も類似しているタンパク質の立体構造のPDB ID を取得し、 構造や特徴を確認しよう。
ただし、相同性検索には、NCBIを使用すること。

戻る