ファイル
このページでは,メニューバーのファイル入出力に関する機能を紹介します.
- [ファイル(_F)]-[開く(_O)] / [保存(_S)] で,分子の構造を記述した XYZ 形式,BCL 形式,PDB 形式および PDBx/mmCIF 形式のファイルを開いたり,保存したりします
- [ファイル(_F)]-[FASTA 形式で出力]では,FASTA 形式でアミノ酸配列を出力します
- [ファイル(_F)]-[Open Babel でインポート] [ファイル(_F)]-[Open Babel でエクスポート] は,Open Babel の共有ライブラリ libopenbabel を利用した入出力機能です
Open Babel による入出力
ファイル形式が多いので,それを選択する操作を独立しています.まずファイル形式を選択し,次いでファイルを選択してください.
ファイル形式の選択
メニューコマンドを実行すると,まずファイル形式選択用のリストが現れます.
目的とするファイル形式を選択して [OK] ボタンをクリックしてください.ファイル選択ダイアログボックスが現れます.
画像では,cif 形式を選択しています.
ファイルの選択
画像は cif 形式を選択したときのファイル選択ダイアログボックスです.
拡張子が cif でない場合でも,他の拡張子が選択できます.
ただし,ファイル形式(今の例では cif 形式)は変更できません.
分子の構造を記述したファイルの独自入出力
メニューバーの [ファイル(_F)]-[開く(_O)] / [保存(_S)] で,XYZ 形式,BCL 形式,および PDB 形式のファイルを開いたり,保存したりします.
XYZ 形式
XYZ 形式で記述したメタンを下に示します.
5 This file was creatwd with Builcule. C -0.00000 0.00000 -0.00000 H 1.07000 0.00000 -0.00000 H -0.35667 0.00000 1.00881 H -0.35667 -0.87365 -0.50440 H -0.35667 0.87365 -0.50440
BCL 形式
BCL 形式は,XYZ 形式に結合情報を追加した独自形式です.
すなわち,原子の通し番号とその原子の結合先の通し番号を記述しています.
BCL 形式で記述したメタンを下に示します.
5 This file was creatwd with Builcule. C -0.00000 0.00000 -0.00000 0 1 2 3 4 H 1.07000 0.00000 -0.00000 1 0 H -0.35667 0.00000 1.00881 2 0 H -0.35667 -0.87365 -0.50440 3 0 H -0.35667 0.87365 -0.50440 4 0
- 1 行めには,原子数が記されています
- 2 行めはコメント行です
- 3 行め以降は,原子ごとの xyz 座標(カルテシアン座標 == ガウス座標)が記されています
- 1 列めは元素記号,2,3,4 列めはそれぞれ,x,y,z 座標です
PDB 形式
PDB 形式はタンパク質の構造を記述する形式の一つです.
下に PDB 形式で記した Gly-Gly の例を示します.
Builcule は,下の例でいうと,右端の元素の列,その左に記している座標を読み取っています.
ATOM 1 N GLY A 1 -2.379 0.509 0.033 N ATOM 2 CA GLY A 1 -1.268 -0.408 -0.202 C ATOM 3 C GLY A 1 0.027 0.289 0.095 C ATOM 4 O GLY A 1 0.148 1.595 0.523 O ATOM 5 N GLY A 2 1.138 -0.628 -0.140 N ATOM 6 CA GLY A 2 2.399 0.051 0.149 C ATOM 7 C GLY A 2 3.541 -0.891 -0.093 C ATOM 8 O GLY A 2 3.294 -2.179 -0.522 O ATOM 9 OXT GLY A 2 4.838 -0.470 0.115 O TER 10 GLY A
PDBx/mmCIF 形式
Builcule-9 では,PDBx/mmCif 形式のファイル (*.cif) を開く機能を追加しました.
cif ファイルの構造は,Data Items Describing Atomic Positions に記述されている "ATOM_SITE Data Entry Example" を参考にしています.
読み取るのは原子ごとの情報を記した行です.
それら各行に記述されている内容を,下に引用します.本来横書きである行の内容が,縦書きに列挙されているので注意してください.
すなわち,Detrial では,行が "ATOM" または "HETATM" で始まっている行の,第 3,11,12,13 レコード(それぞれ元素,X,Y,Z座標)を読み取ります.
# loop_ _atom_site.group_PDB 読むかどうかはこのレコードで判断."ATOM" または "HETATM" であれば読む _atom_site.id _atom_site.type_symbol このレコードを読む(元素) _atom_site.label_atom_id _atom_site.label_alt_id _atom_site.label_comp_id _atom_site.label_asym_id _atom_site.label_entity_id _atom_site.label_seq_id _atom_site.pdbx_PDB_ins_code _atom_site.Cartn_x このレコードを読む(X 座標) _atom_site.Cartn_y このレコードを読む(Y 座標) _atom_site.Cartn_z このレコードを読む(Z 座標) 以下略
cif ファイルの具体例で示すと,
ATOM 4387 N NE2 . HIS D 2 146 ? 29.161 -6.385 24.995 1.00 18.72 ? 146 HIS D NE2 1 ATOM 4388 O OXT . HIS D 2 146 ? 31.310 -12.411 23.487 1.00 25.59 ? 146 HIS D OXT 1 HETATM 4389 C C . CYN E 3 . ? 5.231 -14.989 4.427 1.00 16.65 ? 143 CYN A C 1 HETATM 4390 N N . CYN E 3 . ? 6.279 -15.492 4.453 1.00 23.22 ? 143 CYN A N 1
FASTA 形式でのアミノ酸配列の出力
[ファイル(_F)]-[FASTA 形式で出力(_F)] でアミノ酸配列を出力できます.
コメント行には,分子の通し番号と,その分子内でのペプチドの通し番号とを記述しています.
一行あたり,70 アミノ酸残基を出力します.
独自記号として下記のものを使用しています.
- C : システイン
- c : シスチン
- X : 未同定アミノ酸残基(非架橋)
- x : 未同定アミノ酸残基(架橋)
- p : ヒドロキシプロリン
下は,ペプチドを 2 個含むユニットを FASTA 形式で出力した例です.
>mol : 0, seq : 0 ScALGYSAGPcMGMTSRYFYxGTSMAcETFQYGGcMGNGNNFVTEKEcLQTcRTV >mol : 1, seq : 0 AcNLPIVRGPcRAFIQLWAFDAVKGKcVLFPYGGcQGNGNKFYSEAEcREYcGV