2008年1月11日金曜日

トポロジー図を描く。

今回はタンパク質のトポロジー図を書くためのソフトを紹介。
今回は
・Cygwinがインストールしていること。
・Cygwinをインストールする際にTcl/Tkを入れていること。
の2点が前提となる。
(Cygwinのインストールはこちらを参照。)
Cygwinは起動させて、トポロジー図を描きたいPDBファイルがあるディレクトリにいること。


まずはどの領域がどんな二次構造なのか、把握する。
これはCCP4のProcheckの出力結果を参考にする。
”Residue properties”のページ(出力されるファイルの6つ目に書いてある)で、
真ん中より下に”Secondary structure & estimated accessibility”という欄があるので、
ここに書いてある二次構造を基準とする。

次に、各二次構造間の関係を把握する。
(ex.複数あるβストランドについて、どれとどれが平行、逆平行の関係にあるのか、など)
一番手っ取り早いのはpymolなどでモデルを表示させ、N末端から順番に見ていく。
PCでやりたい人はDSSPというソフトが落ちているので、こちらを入れるとよい。
(gccでコンパイルが必要なので、よく分からない人は使わない方がよいかも。)
入れた後は、こちらのawkスクリプトを用いて、出力結果を整理すると良いかも。
(使い方はリンク先に記述あり。)

最後にトポロジー図を描くソフトを入れる。
入れるといっても、シェルスクリプトなので、ファイルを落としてくるだけ。
こちらのページから”topdraw”のところをクリック。
書かれている内容を別途ファイルに保存(名前を”topdraw.sh”とする。)し、
カレントディレクトリに保存する。
後は保存したファイルに実行権限を付与(chmod +x topdraw.sh)し、
./topdraw
で実行する。
そして、調べた二次構造と二次構造の関係を元にひたすら書くのみ。

意外と簡単かつ楽しく描けるので、ぜひやってみてください。

2007年12月16日日曜日

続・R Valueをまとめる。

前回の記事を書いてから、ふと思った。
”grepでAND検索できたら、1行にまとめられるのでは?”
適当に調べてみたところ、パイプを通すだけでokみたいだった。

そこで、前回のコマンドを変更。

find . -type f ! -path "検索したいフォルダのFull path/"精密化後のpdbファイル名" -print0
| xargs -0 grep " R VALUE "
| grep -v " BIN "
| grep -v " ESU "
| grep -v " \/ccp4\/ " >test.txt

まだ試してないので、週明け実験室へ行って試してみる予定。
また追記します。メモまでに。

2007年12月14日金曜日

R Valueをまとめる。

回折強度データを取り終えたあと、モデル構築、及び構造精密化において、
モデリングソフト(coot、quanta等)と精密化計算ソフト(CNS、refmac5など)を両用して、
行っていく人がほとんどだと思う。
このとき、私はモデリングの各段階ごとにフォルダを作成し、精密化を行っている。
(たとえば、1回目のcootモデリングはcoot1…以下、N回目のcootモデリングはcootNとなる。)

モデリングの際に、気になる値(R Value等)を控えておけばよいが、忘れることもしばしば。
そこで、Linuxのコマンドを使って、あるフォルダ下のPDBファイルから、

R Value(の行を)抜き出すコマンド群を考えた。

結果を以下に記載する。

参考にしたHPはこちら



################################################################################



find . -type f ! -path "検索したいフォルダのFull path/hoge.pdb" -print0 | xargs -0 grep " R VALUE " >test.txt

#各フォルダよりR VALUEの値を拾ってくる。R VALUE後のスペース必須!



grep -v " BIN " test.txt > test1.txt

grep -v " ESU " test1.txt > test2.txt

#要らないところの除去 BIN r valueとかESU r valueとかあるらしいので。



grep "t[0-9]\/refmac後のpdbファイル名" test2.txt > test_1-.txt

grep "t[0-9][0-9]\/refmac後のpdbファイル名" test2.txt > test_10-.txt

#要らないところの除去 coot*/"refine-file.pdb"以外をはじくため。



cat test_1.txt test_10-.txt > r-value.txt

#1-9と10~を統合



#足りないところはtest.txtから随時補う。



################################################################################



できれば1ラインで書きたいのだけど…。

加えて、汚いカンジがするんので、改良が必要。

2007年11月12日月曜日

pymolの結晶軸表示

構造生物学、とくにX線のラボの方はほぼ100%使うpymol。
これで、結晶軸の表示ができる。

方法はViewerの窓で、軸を表示させたい"object"の"show"をクリック、
"cell"を選択すると表示される。

以前から知っていたけど、忘れないようにメモ。

2007年10月30日火曜日

環境設定について


今日からここで、自分が研究(構造生物学)に使用しているソフトについて、
セットアップ(と余力があれば、使い方も)を記載してみることにする。


最初は環境設定について。
構造生物学で用いるソフトはLinux環境で動くものが多い。
このため、windows上でLinux環境を実現する必要がある。
このblogでは、これを、Cygwinを用いて実現させる。
Cygwinは無料で手に入れることができるため、
お金がない学生でも、気楽に始めることができる。
(なお、Linux環境をエミュレートする有料ソフトとしては、
ASTEC-Xがあげられるが、ここでは触れない。)


では実際にインストールしてみよう。
…と、ここで実際にインストールする手順を詳細に記すべきだが、
図解つきで説明しているサイトを発見したので、
こちらを参照にインストールしていただきたい。
(他にも"Cygwin インストール"と検索すればたくさん出てくるので、ぜひ調べてインストールしてほしい。)


途中、インストールするパッケージについて聞かれるが、
defultのもの以外に以下のものを必ず選択してほしい。
・tcsh
・make
・g77
・Tcl/Tk
・jpeg
・libpng
・X11関連のパッケージすべて
以上である。
インストールに成功した暁には、
windows上でLinux環境を実現させることができる。


次からは実際に自分が使用しているソフトについて、
書いていこうと思う。