BProperty
BProperty は,分子の性質を出力するソフトウェアです.
分子の性質は,Builcule と Detrial で開発したものです.
ファイルを指定,あるいはディレクトリを指定することにより分子構造ファイルから情報を読み取り,標準エラー出力します.
対応しているファイル形式は PDB,XYZ,および 当サイトの独自形式である BCL の各形式です.
ビルドとインストール
ソースファイル
libbuilcule-2:ライブラリのページへのリンクです.先にライブラリをインストールしてください
bproperty-1.0.0.tar.gz
ビルドとインストール
ダウンロードした bproperty-1.0.0.tar.gz を解凍し,生成するディレクトリに移動します.
~$ tar -zxvf bproperty-1.0.0.tar.gz
~$ cd bproperty-1.0.0
Makefile 作成ツールには,Automake を使っています.Automake の常法どおり,
~/bproperty-1.0.0$ ./configure
~/bproperty-1.0.0$ make
~/bproperty-1.0.0$ sudo make install
とすれば,/usr/local/bin に bproperty がインストールされます.
アンインストール
実行ファイルがインストールされるだけなので,これを削除してください.
~/$ sudo rm /usr/local/bin/bproperty
BPeptGen 補足:ペプチド数と鎖長の上限を変更する場合
ソースコードにはペプチド数の上限を 100,鎖長の上限を 70 と記しています.
変更する場合は,下のように変更してビルドしてください.
- 鎖長の上限を変更する場合は,src/spec_seq.cc というファイルの冒頭にある,MaxLength(70) を変更
- ペプチド数の上限を変更する場合は,src/spec_fasta.cc というファイルの冒頭にある,MaxSize(100) を変更
改定履歴
2023 年 10 月 2 日 : 1.0.0 リリース.Makefile 作成ツールを GNU Automake に変更したついでに,バージョン番号を付けました.
2023 年 5 月 2 日:α-1 リリース.
マニュアル
オプション
bproperty abcf:d:hv
・a ファイル名, 原子数, 分子数, 元素組成, 化学式量, 原子番号の総和を csv 形式で標準エラー出力します
・b ファイル名, 距離の平均, 距離の分散, 固有値を標準エラー出力します
・c 検知できたペプチドを FASTA 形式で標準エラー出力します
・f: ファイルを指定します
・d: ディレクトリを指定します.ディレクトリ内に存在する対応ファイルすべてを処理します
・h ヘルプを表示して終了します
.v バージョンを表示して終了します
- ショートオプション(1 ハイフン + 1 文字)のみ使えます
- パスは相対パスでも絶対パスでも構いません
- ディレクトリを指定する場合は末尾の / はあっても無くても構いません
- f および d オプション両方を省略すると,カレントディレクトリのファイルを走査します
- 出力されるファイル名はソートされていません(順番はバラバラ)
固有値について
ここでの固有値は,原子の座標に関する分散・共分散行列の固有値です.
原子の座標分布を統計量と捉え,分子の概形を得ることを目的としています(後述する使用法 [2] 参照).
使用法
[1] ファイル名, 原子数, 分子数, 元素組成, 化学式量, 原子番号の総和
bproperty -d ディレクトリパス -a
または
bproperty -f ファイルパス -a
もう少し具体的に:
~$ bproperty -d /home/User/wk/ -a
とすると,/home/User/wk/ 内にある対応ファイルを読み込んで,表記の情報を csv 形式で標準エラー出力します.
ファイルに保存する場合は,リダイレクト(標準エラー出力なので 2>)してください.例えば,
~$ bproperty -d /home/User/wk/ -a 2> output.txt
下に出力例を示します.
BPeptgen で 20 個のペプチドを作成し,その内容をチェックしてみました.
なお,原子番号の総和は,HOMO の軌道番号のつもりです.
ファイル名, 原子数, 分子数, 元素組成, 化学式量, 原子番号の総和 13.pdh, 176, 1, H:81_C:57_N:18_O:20_, 1338.4, 709 16.pdh, 145, 1, H:69_C:44_N:16_O:14_S:2_, 1110.29, 589 09.pdh, 157, 1, H:77_C:52_N:10_O:18_, 1130.24, 603 15.pdh, 178, 1, H:84_C:62_N:14_O:17_S:1_, 1329.5, 706 02.pdh, 184, 1, H:89_C:63_N:14_O:17_S:1_, 1346.55, 717 06.pdh, 173, 1, H:86_C:57_N:13_O:15_S:2_, 1257.53, 671 12.pdh, 177, 1, H:91_C:55_N:15_O:16_, 1218.43, 654 18.pdh, 156, 1, H:78_C:50_N:13_O:14_S:1_, 1117.32, 597 10.pdh, 175, 1, H:89_C:56_N:14_O:16_, 1214.41, 651 08.pdh, 158, 1, H:77_C:50_N:13_O:17_S:1_, 1164.32, 620 05.pdh, 143, 1, H:70_C:43_N:15_O:13_S:2_, 1069.28, 569 03.pdh, 169, 1, H:84_C:51_N:17_O:16_S:1_, 1223.42, 653 11.pdh, 143, 1, H:67_C:48_N:14_O:14_, 1064.16, 565 19.pdh, 180, 1, H:94_C:54_N:19_O:13_, 1217.48, 655 04.pdh, 189, 1, H:99_C:63_N:14_O:12_S:1_, 1276.63, 687 14.pdh, 154, 1, H:79_C:50_N:10_O:14_S:1_, 1076.3, 577 07.pdh, 167, 1, H:87_C:53_N:11_O:15_S:1_, 1150.41, 618 17.pdh, 180, 1, H:82_C:65_N:14_O:18_S:1_, 1379.52, 730 00.pdh, 157, 1, H:76_C:55_N:12_O:13_S:1_, 1145.35, 610 01.pdh, 162, 1, H:84_C:49_N:11_O:16_S:2_, 1147.41, 615
[2] ファイル名, 距離の平均, 距離の分散, 固有値
ここでの固有値は,原子の座標に関する分散・共分散行列の固有値です.
原子の空間内での分布を統計量と捉え,分子の概形を得ることを目的としています.
画像は,当サイトで開発している分子表示ソフト Detrial で,分散・共分散行列の固有ベクトルを円錐で表示したところです.
円錐の高さ(固有ベクトルのノルム)は,固有値の 2 倍に設定しています.
すなわち細長い分子ほど,長軸に沿った円錐の高さが相対的に大きくなるように描いています.
bproperty -d ディレクトリパス -b
または
bproperty -f ファイルパス -b
もう少し具体的に:
~$ bproperty -d /home/User/wk/ -b
とすると,/home/User/wk/ 内にある対応ファイルを読み込んで,表記の情報を csv 形式で標準エラー出力します.
ファイルに保存する場合は,リダイレクトしてください(標準エラー出力なので 2>).例えば,
~$ bproperty -d /home/User/wk/ -b 2> output.txt
出力例
下に出力例を示します.
前のセクションと同じファイルについて,その内容をチェックしてみました.
ファイル名, 距離の平均, 距離の分散, 固有値 0, 固有値 1, 固有値 2 13.pdh, 9.85156, 26.0606, 1.83435, 8.62647, 113.353 16.pdh, 9.20655, 22.2891, 2.32772, 7.09835, 98.3618 09.pdh, 9.87207, 26.8053, 1.48682, 5.28692, 118.281 15.pdh, 10.4279, 25.7334, 1.87648, 7.71015, 125.644 02.pdh, 10.3078, 25.5187, 1.87463, 8.82634, 121.784 06.pdh, 10.1148, 23.499, 2.57387, 7.07656, 116.886 12.pdh, 10.8499, 28.066, 1.42951, 7.81387, 137.367 18.pdh, 10.3354, 24.8234, 1.95739, 6.31349, 124.217 10.pdh, 10.6041, 28.6543, 1.91705, 6.98265, 133.008 08.pdh, 10.3187, 27.9784, 1.57254, 5.86564, 127.867 05.pdh, 10.5288, 27.4661, 1.44501, 7.55912, 130.284 03.pdh, 10.4707, 27.072, 1.50043, 7.14748, 128.869 11.pdh, 10.1231, 25.7535, 1.53291, 4.88474, 122.709 19.pdh, 10.0842, 26.6138, 1.78261, 8.60548, 118.63 04.pdh, 9.83668, 23.1045, 2.07353, 7.48926, 110.936 14.pdh, 9.72723, 24.7733, 1.61928, 6.15397, 112.394 07.pdh, 10.1292, 27.026, 1.71791, 6.2239, 122.462 17.pdh, 10.1718, 25.2783, 2.16485, 7.86688, 119.428 00.pdh, 9.59121, 23.0246, 1.96454, 4.82129, 108.963 01.pdh, 9.95919, 27.0541, 1.45371, 6.81451, 118.751
[3] FASTA 形式
bproperty -d ディレクトリパス -c
または
bproperty -f ファイルパス -c
もう少し具体的に:
~$ bproperty -d /home/User/wk/ -c
とすると,/home/User/wk/ 内にある対応ファイルを読み込んで,検知されたペプチドの配列を FASTA 形式で標準エラー出力します.
ファイルに保存する場合は,リダイレクト(標準エラー出力なので 2>)してください.例えば,
~$ bproperty -d /home/User/wk/ -c 2> output.txt
下に出力例を示します.
前のセクションと同じファイルについて,アミノ酸配列を出力させました.
コメント行に出力するのは順次,ファイル名,ファイル内で検知された分子の番号,分子内で検知されたペプチドの番号,正電荷,負電荷です.
正電荷は,Lys,Arg,His の個数に N-末分の 1 を加えた数値です.
負電荷は,Glu,Asp の個数に C-末分の 1 を加えた数値です.
>13.pdh Mol: 0 Pept: 0 charge: +3 charge: -4 RNYFRPEDNE >16.pdh Mol: 0 Pept: 0 charge: +2 charge: -1 NGNMCWRTAG >09.pdh Mol: 0 Pept: 0 charge: +1 charge: -4 APYIDLDDVI >15.pdh Mol: 0 Pept: 0 charge: +3 charge: -3 DYHDINFFMK >02.pdh Mol: 0 Pept: 0 charge: +2 charge: -3 YDMRNIIEFF >06.pdh Mol: 0 Pept: 0 charge: +2 charge: -1 CKIWMSYTPQ >12.pdh Mol: 0 Pept: 0 charge: +2 charge: -2 VQITQDVIFR >18.pdh Mol: 0 Pept: 0 charge: +3 charge: -2 EHVCKGPFLS >10.pdh Mol: 0 Pept: 0 charge: +3 charge: -2 IPVEQYSHKI >08.pdh Mol: 0 Pept: 0 charge: +2 charge: -2 VDLISHCTNY >05.pdh Mol: 0 Pept: 0 charge: +2 charge: -1 NNMCGRAGVF >03.pdh Mol: 0 Pept: 0 charge: +4 charge: -3 MDVDTLHVRH >11.pdh Mol: 0 Pept: 0 charge: +2 charge: -1 FGLGFGNHQS >19.pdh Mol: 0 Pept: 0 charge: +4 charge: -1 PPPTRQRLLH >04.pdh Mol: 0 Pept: 0 charge: +2 charge: -1 WMRIVFIIPT >14.pdh Mol: 0 Pept: 0 charge: +1 charge: -2 LIAMPFISDA >07.pdh Mol: 0 Pept: 0 charge: +1 charge: -1 SMSLLPQLYV >17.pdh Mol: 0 Pept: 0 charge: +3 charge: -3 YCFYEKENFH >00.pdh Mol: 0 Pept: 0 charge: +1 charge: -1 WCYQPPLPAA >01.pdh Mol: 0 Pept: 0 charge: +2 charge: -1 TSLSMKMTTF