2005年度 生命情報計算機演習

<< back | next >>

第3回 タンパク質立体構造分類データベース:CATH、SCOP

■ タンパク質立体構造分類データベース

タンパク質そのもの、つまりアミノ酸配列は、全体で約10万種類以上あるとも言われていますが、 タンパク質を構成する基本立体構造は、約1万種類程度しかないと考えられています。 この立体構造に着目し、階層的に分類、比較を行っているデータベースが SCOP や CATH です。 このような構造分類は、タンパク質の機能を予測・解析するのに非常に重要です。

それぞれのサイトへはもちろん直接アクセスできますが、PDB からもリンクが張られていて(Structural Neighbors)、 対象としているタンパク質がどの分類に属するのかを知ることができます。

CATH Protein Structure Classification

University College London により構築されたデータベースです。 タンパク質の立体構造をプログラムによりドメイン単位に分割し、 分割されたドメイン構造をプログラムおよび人の目で分類します。 次に、CATH で定義されている階層について示します。

  1. Class (C):二次構造のタイプにより Mainly Alpha、Mainly Beta、Mixed Alpha-Beta、Few Secondary Structures の4種類に分類
  2. Architecture (A):二次構造の相対的な配置が類似しているもの
  3. Topology (T):二次構造の相対的な配置とつながり方が類似しているもの
  4. Homologous Superfamily (H):共通の進化的起源をもっていると予想されるもの
  • PDB からのアクセス
  • Structural Neighbors のトップにある CATH をクリック。 PDB3VHB という ID で登録されている2つの分子がリストされます。



    ここで、Domain という項目の文字をクリックすると、 その分子に関する CATH における登録情報が表示されます。 立体構造および配列により詳細に分類されています。



    数字は、各階層(Level)での分類を表しています。 Class の右の 1 をクリックすると Class1(Mainly Alpha) に存在する 5つの Architecture レベルがリストで表示されます。



SCOP(Structural Classification of Proteins)

英国 MRC Laboratory of Molecular Biology により構築されたデータベース。
タンパク質の立体構造を目で比較し、手動で分類しています。次の階層により分類されています。
  1. Class:主に二次構造のタイプにより All α、All β、α/β、α+β、マルチドメインタンパク質、膜タンパク質、小さなタンパク質、コイルドコイル、低解像度、ペプチド、デザインされたタンパク質に分類
  2. Fold:立体構造のみが類似
  3. Superfamily:アミノ酸配列の相同性は低いが、立体構造および機能が類似
  4. Families:アミノ酸配列の相同性が高いグループ
"Bacterial Hemoglobin""Heme-binding protein" といった情報も見ることができ、 CATH よりも機能に関する情報を得やすい。



[ 課題 3 ]
次のタンパク質の機能、立体構造の特徴について調べ、2つのタンパク質の関連について考察しなさい。 また、アミノ酸配列、立体構造データをそれぞれダウンロードしなさい。
・Homo sapiens(Human) Lysozyme (130残基)
・Homo sapiens(Human) α-Lactalbumin (123残基)
 ※ PDB ファイルは提出しなくてもよい。レポートには PDB ID を記載しておくこと。

<< back | next >>
© kazuo 2005