ペプチドの二面角.測定と解析

タンパク質の高次構造を表現する一つの手段として,主鎖付近の二面角,Ψ,Φ に加え最初の側鎖二面角 χ1 を測定し,それらがどのように分布しているのか調べてみた.
Ψ と Φ を散布図にプロットしたものが Ramachandran プロットであるが,このページではそれを拡張し,側鎖の方向も含めて検討するということである.
なお,このページでの角度はラジアンで標記している.

Ψ や Φ の取る範囲が限定されているのと同様,χ1 のとる範囲も制限されていることが確認できた.
例えば.α-ヘリックスや β-シートでは,χ1 も一定の範囲に分布していると言えそうである.
得られた結果は,R でヒストグラムや散布図として表示した.さらに,自作のソフトウェアでもリボンモデルでの表現が可能であることを示した.

注.
このページでの Ψ,Φ の測定法は一般的なものと異なる(コーディングしやすい測定法である).原理的に同等なので,通常の測定法に換算していない.
また,側鎖二面角 χ1 とさらに側鎖の葉方向に向かって測定した χ2 をプロットしたものを Janin プロットというので,測定の範囲を広げることを課題と認識しておく.

インフォメーション

ソフトウェア

PDB ファイルからのタンパク質の単離とクリーンアップは,Builcule で,測定は Detrial を改変しておこなった.

目次(ページ内リンク)


二面角の測定法
結果と考察

二面角の測定法

試料

トリプシン(4BNR.pdb),ヒト血清アルブミン(4la0.pdb),ピルビン酸キナーゼ(4g1n.pdb),およびヘモグロビン(1mbn.pdb)を試料とした.
これらは RCSB PDB: Homepage からダウンロードした.
トリプシンは β-シートに富む,ヘモグロビンは大部分が α-ヘリックスから成るという程度の根拠である.
Builcule を使い,各 PDB ファイルから目的のタンパク質を単離し,クリーンアップした.

二面角の名称

ポリペプチドの模式図

タンパク質を構成する原子には,元素と残基中での位置を表す記号が与えられている.
主鎖の窒素は "N",アルファ炭素は "CA",カルボニル炭素は "C",カルボニル酸素は "O" である.
側鎖の位置を表す記号ははベータ,ガンマと続く.例えば,ベータ炭素は "CB",セリンのガンマ酸素は "OG" である.

画像はポリペプチドの一部を模式的に表したものである.
図ではガンマ位は,炭素としているが,Ser では酸素,Cys ではイオウである.また Val や Ile では 2 個の炭素がある.さらに,Gly や Ala には存在しない.
Val の 2 個のガンマ位炭素 CG1 と CG2 は区別しなかった.最初に検知した原子を CG1 としている.
下に挙げる原子の組み合わせが形成する二面角を測定することにした.ここでは,A〜C を二面角の略号とする.

  1. 二面角 A : C'-N-CA-C(Ψ に相当する二面角)
  2. 二面角 B : N-CA-CB-Gamma(主鎖に対する側鎖の方向を示す二面角)
  3. 二面角 C : N-CA-C-N'(Φ に相当する二面角)

二面角の測定方法

二面角の模式図

測定は,Detrial を改変しておこなった.
計算には数値計算用のテンプレートライブラリ Eigen で測定した.
cosθ を θ に変換する部分は C++ の関数を使っている.

ベクトルの取り方によって測定値が変わるので,二面角 A(Ψ に相当) を例にして手順を紹介しておく(画像参照).
(1) C'-N-CA が形成する平面に直行するベクトル(法線という)を求め,標準化する
具体的には,ベクトル N → C' と ベクトル N → CA の外積を求め,それを標準化する.これを v1 とする.
(2) N-CA-C が形成する平面に対する法線を求め,標準化する
同様に,ベクトル CA → N と ベクトル CA → C の外積を求め,それを標準化する.これを v2 とする.
(3) 標準化した法線(v1 と v2)の内積が,求めたい二面角のコサインである.

角度の表現に関する補足

二面角の模式図

ただし,上の方法では二面角は鋭角が正の値で得られる.
画像はジクロロメタンで二面角を表現しているのであるが,「向こう側」が「こちら側」に対して反時計周りに回転している.
これを 30度 と表すか,330度 と表すか -30度 と表すか(この数字自体に意味はない),決めておく.

二面角を構成する 3本 のベクトルで 3×3 行列を作成すると,行列式の符合がその二面角が時計回りか反時計わまりかを示す.
これを利用し,-π 〜 π の値が得られるようにした.

結果と考察

出力ファイル

測定した角度(弧度法)を CSV 形式で出力した.下にその一部分を示す.
第 1 列はアミノ酸の 1 文字コードである.

Code, A, B, C
L, 1.72782, 1.57853, -2.7223
S, 1.45785, -1.15656, -3.02605
D, 1.04276, 1.20467, 0.703871
E, 1.29667, 1.34362, 0.730074
W, 0.999449, 1.50127, 0.703682

R による要約情報を見てみる

コードとその出力を後で示す.
四分値を比べると,二面角 A(Ψ に相当) が最も狭い範囲に分布している(二面角の制限が最大).
二面角 B(主鎖に対する側鎖の方向)と二面角 C(Φ に相当) については,中央値と最頻値が大きく異なっている.

$ R
> angle <- read.csv("angle.csv")
> summary(angle)


      Code           A                B                 C          
 L      :132   Min.   :-3.059   Min.   :-3.1406   Min.   :-3.1180  
 E      :122   1st Qu.: 1.083   1st Qu.:-0.8174   1st Qu.:-2.0694  
 K      :119   Median : 1.225   Median : 1.1051   Median : 0.4819  
 V      :111   Mean   : 1.363   Mean   : 0.5449   Mean   :-0.3448  
 D      : 90   3rd Qu.: 1.634   3rd Qu.: 1.4064   3rd Qu.: 0.7259  
 T      : 78   Max.   : 3.071   Max.   : 3.1402   Max.   : 3.0781  
 (Other):584 

R でヒストグラムを描いてみる

ペプチドの二面角のヒストグラム

それぞれの二面角について,
画面を 4 分割し,スケールを揃えて 3 系列のヒストグラムを描いてみた.
(メモ:seq の引数 -3.5, 3.5 の部分を -pi, pi と書くと「範囲全体をカバーしていません」と返される)

> png("./diheadral_2.png")
> par(mfrow=c(2,2))
> hist(angle$A, breaks=seq(-3.5, 3.5, 0.5), xlim=c(-pi, pi), ylim=c(0,800))
> hist(angle$B, breaks=seq(-3.5, 3.5, 0.5), xlim=c(-pi, pi), ylim=c(0,800))
> hist(angle$C, breaks=seq(-3.5, 3.5, 0.5), xlim=c(-pi, pi), ylim=c(0,800))
> dev.off()

ヒストグラムを見ると,
二面角 A(Ψ に相当) については,ほぼ 0.5〜2.5 に,
二面角 C (Φ に相当)については,-3〜-2 付近と 0〜1 付近に分布している.

二面角 B(主鎖に対する側鎖の方向)については,3 個のピークに分裂している(左端と右端とは連続している,はず).
ピーク どうしの間隔は だいたい 120度 ほどのようである.

主鎖のリボンモデルを色付けする

タンパク質主鎖のリボンモデル

ポリペプチド主鎖を構成する原子について,連続する 3 原子(N-CA-C,CA-C-N,C-N-CA・・・)の座標を頂点とする三角形を並べると,
ポリペプチド主鎖をリボンモデルで表現できる.

ヒストグラムでの二面角 A(Ψに相当) と二面角 C(Φに相当)の分布から,これらを組み合わせて,
二面角 A が 0.5〜2.5 かつ二面角 C が 0〜1 を赤色
二面角 A が 0.5〜2.5 かつ二面角 C が -3〜-2 を黄色,
でリボンモデルを着色してみた.

画像はその一例である.
α-ヘリックスと β-シートが検知できたようだ.

側鎖の二面角の分布

主鎖と側鎖の二面角の散布図

側鎖の二面角と主鎖の二面角との関係,側鎖の嵩高さの影響を調べた.
ここでは二面角 C(Φに相当) に対して二面角 B(主鎖に対する側鎖の方向) をプロットした散布図を示した(上端と下端とは連続している).

png("diheadral_4.png")
big <- angle[angle$Code=="W" | angle$Code=="F" | angle$Code=="Y" | angle$Code=="H",] #側鎖がかさ高いアミノ酸を抽出
small <- angle[angle$Code=="V" | angle$Code=="S" | angle$Code=="C" | angle$Code=="T",] #側鎖が小さいアミノ酸を抽出
plot(small$C, small$B, col="red") #側鎖が小さいアミノ酸を赤でプロット
points(big$C, big$B, col="blue") #側鎖がかさ高いアミノ酸を青でプロット
dev.off()

縦軸の値が 1 付近の場合,青丸の横軸方向の分布はあまり制限されていないようにも見える.
術語を使うと,「二面角 B(主鎖に対する側鎖の方向)の値が 1 付近となる場合には,嵩高い側鎖(青丸)の二面角 C(Φに相当)はあまり制限されない」ということで,逆ではないかという気はする.
この観察は,データ数を増やせば変わるかもしれない.

主鎖と側鎖の一部を含むリボンモデルを色付けする

タンパク質主鎖と側鎖の一部のリボンモデル

予めリボンモデルをガンマ位まで表示できるように拡張しておいた.

上の散布図を参照して,二面角 B(主鎖に対する側鎖の方向)と二面角 C(Φに相当)の分布をもとにリボンモデルを色分けした.
ここで,
C が 0〜1 ,かつ B が -2 以下または 2 以上が赤色である.
C が -3〜-2 ,かつ B が -2 以下または 2 以上が黄色である.
赤色と黄色の分布は,主鎖のリボンモデルの場合と似たものとなった.


参考書の検索