ファイル

このページでは,メニューバーのファイル入出力に関する機能を紹介します.

Open Babel による入出力

ファイル形式が多いので,それを選択する操作を独立しています.まずファイル形式を選択し,次いでファイルを選択してください.

ファイル形式の選択

ファイル形式選択用のリスト

メニューコマンドを実行すると,まずファイル形式選択用のリストが現れます.
目的とするファイル形式を選択して [OK] ボタンをクリックしてください.ファイル選択ダイアログボックスが現れます.

画像では,cif 形式を選択しています.

ファイルの選択

ファイル選択ダイアログボックス

画像は cif 形式を選択したときのファイル選択ダイアログボックスです.

拡張子が cif でない場合でも,他の拡張子が選択できます.
ただし,ファイル形式(今の例では cif 形式)は変更できません.

分子の構造を記述したファイルの独自入出力

メニューバーの [ファイル(_F)]-[開く(_O)] / [保存(_S)] で,XYZ 形式,BCL 形式,および PDB 形式のファイルを開いたり,保存したりします.

XYZ 形式

XYZ 形式で記述したメタンを下に示します.

5
This file was creatwd with Builcule.
C         -0.00000        0.00000       -0.00000
H          1.07000        0.00000       -0.00000
H         -0.35667        0.00000        1.00881
H         -0.35667       -0.87365       -0.50440
H         -0.35667        0.87365       -0.50440

BCL 形式

BCL 形式は,XYZ 形式に結合情報を追加した独自形式です.
すなわち,原子の通し番号とその原子の結合先の通し番号を記述しています.
BCL 形式で記述したメタンを下に示します.

5
This file was creatwd with Builcule.
C         -0.00000        0.00000       -0.00000         0         1         2         3         4
H          1.07000        0.00000       -0.00000         1         0
H         -0.35667        0.00000        1.00881         2         0
H         -0.35667       -0.87365       -0.50440         3         0
H         -0.35667        0.87365       -0.50440         4         0

PDB 形式

PDB 形式はタンパク質の構造を記述する形式の一つです.
下に PDB 形式で記した Gly-Gly の例を示します.
Builcule は,下の例でいうと,右端の元素の列,その左に記している座標を読み取っています.

ATOM      1  N   GLY A   1      -2.379   0.509   0.033                       N
ATOM      2  CA  GLY A   1      -1.268  -0.408  -0.202                       C
ATOM      3  C   GLY A   1       0.027   0.289   0.095                       C
ATOM      4  O   GLY A   1       0.148   1.595   0.523                       O
ATOM      5  N   GLY A   2       1.138  -0.628  -0.140                       N
ATOM      6  CA  GLY A   2       2.399   0.051   0.149                       C
ATOM      7  C   GLY A   2       3.541  -0.891  -0.093                       C
ATOM      8  O   GLY A   2       3.294  -2.179  -0.522                       O
ATOM      9  OXT GLY A   2       4.838  -0.470   0.115                       O
TER      10      GLY A

PDBx/mmCIF 形式

Builcule-9 では,PDBx/mmCif 形式のファイル (*.cif) を開く機能を追加しました.
cif ファイルの構造は,Data Items Describing Atomic Positions に記述されている "ATOM_SITE Data Entry Example" を参考にしています.

読み取るのは原子ごとの情報を記した行です.
それら各行に記述されている内容を,下に引用します.本来横書きである行の内容が,縦書きに列挙されているので注意してください.

すなわち,Detrial では,行が "ATOM" または "HETATM" で始まっている行の,第 3,11,12,13 レコード(それぞれ元素,X,Y,Z座標)を読み取ります.

#
loop_
_atom_site.group_PDB 読むかどうかはこのレコードで判断."ATOM" または "HETATM" であれば読む
_atom_site.id
_atom_site.type_symbol  このレコードを読む(元素)
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x  このレコードを読む(X 座標)
_atom_site.Cartn_y  このレコードを読む(Y 座標)
_atom_site.Cartn_z  このレコードを読む(Z 座標)
以下略

cif ファイルの具体例で示すと,

ATOM   4387 N  NE2 . HIS D 2 146 ? 29.161  -6.385  24.995  1.00 18.72 ? 146  HIS D NE2 1 
ATOM   4388 O  OXT . HIS D 2 146 ? 31.310  -12.411 23.487  1.00 25.59 ? 146  HIS D OXT 1 
HETATM 4389 C  C   . CYN E 3 .   ? 5.231   -14.989 4.427   1.00 16.65 ? 143  CYN A C   1 
HETATM 4390 N  N   . CYN E 3 .   ? 6.279   -15.492 4.453   1.00 23.22 ? 143  CYN A N   1 

FASTA 形式でのアミノ酸配列の出力

[ファイル(_F)]-[FASTA 形式で出力(_F)] でアミノ酸配列を出力できます.
コメント行には,分子の通し番号と,その分子内でのペプチドの通し番号とを記述しています.
一行あたり,70 アミノ酸残基を出力します.
独自記号として下記のものを使用しています.

下は,ペプチドを 2 個含むユニットを FASTA 形式で出力した例です.

>mol : 0, seq : 0
ScALGYSAGPcMGMTSRYFYxGTSMAcETFQYGGcMGNGNNFVTEKEcLQTcRTV
>mol : 1, seq : 0
AcNLPIVRGPcRAFIQLWAFDAVKGKcVLFPYGGcQGNGNKFYSEAEcREYcGV