Skip to content

Commit

Permalink
fix markdown syntax
Browse files Browse the repository at this point in the history
  • Loading branch information
YoshitakaMo committed Nov 20, 2024
1 parent a5228fa commit cbb716b
Show file tree
Hide file tree
Showing 15 changed files with 74 additions and 50 deletions.
4 changes: 4 additions & 0 deletions .markdownlint.json
Original file line number Diff line number Diff line change
@@ -0,0 +1,4 @@
{
"MD013": false,
"MD041": false
}
10 changes: 7 additions & 3 deletions src/append01/selealgebra.md
Original file line number Diff line number Diff line change
Expand Up @@ -11,6 +11,7 @@ PyMOLのSelection文法を使うことで識別子(identifier)やプロパ
Selectionは、論理演算子(`true/false`のブール型変数、`and`, `or`, `and not`など)と組み合わせることで、より精密に包括的に行うことができます。ブール型の`and`は指定されたプロパティの両方(またはすべて)を持つ項目のみを選択し、`or`はそれらのどちらか(またはいずれか)を持つ項目を選択します。

### 選択演算子/修飾子テーブル

選択演算子と修飾子を以下に示します。ダミー変数`s1``s2`は, `chain a``hydro.`といった選択式を表します。

<table><thead><tr><th> 選択演算子 </th><th> エイリアス </th><th> 説明 </th></tr></thead><tbody>
Expand Down Expand Up @@ -135,8 +136,8 @@ Selectionは、論理演算子(`true/false`のブール型変数、`and`, `or`

### 入力について

- 名前とキーワードは `ignore_case` が設定されていない限り大文字小文字を区別しない。
- 名前とキーワードは、曖昧でない接頭辞に省略することが可能。
- 名前とキーワードは `ignore_case` が設定されていない限り大文字小文字を区別しない。
- 名前とキーワードは、曖昧でない接頭辞に省略することが可能。

**おすすめ設定****大文字小文字を区別**して、**省略されていない選択式**で書きます。そうすることで、実行時の設定や将来の言語の変更 (新しいキーワードの追加など) に対して記述が堅牢になります。

Expand All @@ -148,7 +149,9 @@ Logicalな選択範囲は組み合わせることができます。例えば以
# チェインAの一部であり、残基番号125ではない原子を選択。
select chain A and (not resi 125)
```

以下に様々な選択範囲の結合例を示します。

``` python
# 以下の2つの選択は等価です。
# チェインAにあるCβ、Cγ1、Cγ2原子を選択
Expand Down Expand Up @@ -190,4 +193,5 @@ select bm. c. C
``` python
byres ((chain A or (chain B and (not resi 125))) around 5)
```
PyMOL は、論理的な選択範囲を一番内側の括弧から外に展開します。

PyMOL は、論理的な選択範囲を一番内側の括弧から外に展開します。
5 changes: 4 additions & 1 deletion src/append01/term.md
Original file line number Diff line number Diff line change
@@ -1,7 +1,9 @@
## PyMOLの用語集

気づいたら書いていきます。

### オブジェクト (object)

PyMOL上の**オブジェクト**とは、PyMOL上に表示された構造ファイル、または選択範囲のことです。特に、PyMOLの右側のメニューはオブジェクトを操作する**オブジェクトパネル**と呼ばれます。

<img src="../ch02/image/viewer/objectpanel1.png">
Expand All @@ -11,4 +13,5 @@ PyMOLでは構造情報だけでなく、選択範囲についてもオブジェ
<img src="../ch02/image/viewer/objectpanel2.png">

### セグメント(segment identifier)
**セグメント**とは、構造ファイルの中のsegment identifier(segment ID)に登録されている情報のことです。かつて`.pdb`ファイル形式が主流だった頃、segment identifierは原子の座標を記述する`ATOM`, `HETATM`レコードの中の73〜76行目に記述するようになっていました。特に、同一chain IDにありながらある種の原子のグループごとに分けて記述したい場合(例:共有結合しているタンパク質とリガンドを分けたい時)に用いられましたが、今はChain IDで分けるのが主流となっています。segment identifierは現在廃止された仕様ですが、PyMOLやChimera, CHARMMなど一部のプログラムは未だにこれを利用することができます。

**セグメント**とは、構造ファイルの中のsegment identifier(segment ID)に登録されている情報のことです。かつて`.pdb`ファイル形式が主流だった頃、segment identifierは原子の座標を記述する`ATOM`, `HETATM`レコードの中の73〜76行目に記述するようになっていました。特に、同一chain IDにありながらある種の原子のグループごとに分けて記述したい場合(例:共有結合しているタンパク質とリガンドを分けたい時)に用いられましたが、今はChain IDで分けるのが主流となっています。segment identifierは現在廃止された仕様ですが、PyMOLやChimera, CHARMMなど一部のプログラムは未だにこれを利用することができます。
1 change: 1 addition & 0 deletions src/ch01/accesspdb.md
Original file line number Diff line number Diff line change
@@ -1,4 +1,5 @@
## Protein Data Bank (PDB)にアクセスする

お使いのパソコンにインストールされているウェブブラウザ(Edge, Safari, Google Chrome, Firefoxなど)の検索エンジンに、「PDB」と入れて検索すると、[RCSB PDB](https://www.rcsb.org/)のホームページが表示されます。

<img src="./image/rcsbpdb1.png" width="70%">
Expand Down
5 changes: 3 additions & 2 deletions src/ch01/colorbychain.md
Original file line number Diff line number Diff line change
@@ -1,8 +1,9 @@
### チェインごとの色分け

このアルカリホスファターゼがホモ2量体であることをわかりやすく表示するために、Aチェインを緑色(デフォルト)、Bチェインを水色(cyan)で表示してみます。PyMOL右下の画面に`S`という小さなボタンがあるので、ここを押すと、タンパク質が表示されている画面の上にアミノ酸配列が現れます(参考: [配列の表示について](../ch02/dispseq.md) )。

<img src="./image/colorchain.png" alt="チェインごとの色分け">
![チェインごとの色分け](./image/colorchain.png)

今表示されたアミノ酸配列の上で、マウスを使ってチェインBをすべて選択します。次に、色の設定を参考にしてチェインBを水色に変更します(参考:[色の設定](../ch02/color.md) )。

※ PyMOLの画面上に存在する入力欄`PyMOL> `の所(中段上と一番下の2ヶ所に存在しますが、どちらに入力してもOK)で上や下の矢印キーを押すと、それまでに入力したコマンドを再び呼び出すことができます。また左右の矢印キーを使って、以前使ったコマンドを自由に編集できます。同じコマンドを何度も入力するのは面倒なので、上下左右の矢印キーを上手に使いましょう。
※ PyMOLの画面上に存在する入力欄`PyMOL>`の所(中段上と一番下の2ヶ所に存在しますが、どちらに入力してもOK)で上や下の矢印キーを押すと、それまでに入力したコマンドを再び呼び出すことができます。また左右の矢印キーを使って、以前使ったコマンドを自由に編集できます。同じコマンドを何度も入力するのは面倒なので、上下左右の矢印キーを上手に使いましょう。
7 changes: 4 additions & 3 deletions src/ch01/colorbyss.md
Original file line number Diff line number Diff line change
@@ -1,12 +1,13 @@
### 二次構造ごとの色分け

この大腸菌アルカリホスファターゼを、今度は二次構造による色分けを使って表示してみます(参考: [色の設定について](../ch02/color.md) )。

オブジェクトパネルにおける`1ALK`のCのところをクリックし、Colorのメニューのところで、[by ss]にマウスを重ねます。色分けの種類はデフォルトで3種類用意されており、どれを使っても問題ありませんが、ここでは一番上の例(ヘリックス:赤; シート:黄; ループ:緑)のカラーリングで表示してみます。

<img src="./image/colorbyss1.png" alt="" title="">
![colorbyss1](./image/colorbyss1.png)

このように表示されるはずです。

<img src="./image/colorbyss2.png" alt="" title="">
![colorbyss2](./image/colorbyss2.png)

ここで、大腸菌アルカリホスファターゼの立体構造のCATHによる分類は、"Alpha Beta 3-Layer(aba) Sandwich"とされています。Cartoon表示で見る角度を調節して、このタンパク質の立体構造がCATHの分類通りにAlpha Betaの3層構造を形成していることを確認してみましょう。
ここで、大腸菌アルカリホスファターゼの立体構造のCATHによる分類は、"Alpha Beta 3-Layer(aba) Sandwich"とされています。Cartoon表示で見る角度を調節して、このタンパク質の立体構造がCATHの分類通りにAlpha Betaの3層構造を形成していることを確認してみましょう。
16 changes: 8 additions & 8 deletions src/ch01/conservation.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,37 +6,37 @@

以上のことを、アルカリホスファターゼについて確認してみましょう。まずは、**PDBsum** ([https://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/pdbsum/GetPage.pl?pdbcode=index.html](https://www.ebi.ac.uk/thornton-srv/databases/cgi-bin/pdbsum/GetPage.pl?pdbcode=index.html)) というデータベースに登録されているデータを用います。PDBsumはPDBに登録された生体分子の構造データを加工したデータベースの1つで、配列・構造情報・リガンド結合・文献情報などをわかりやすくまとめてあります。ここのトップページのフォームに、調べたいPDBデータのIDを入れてFindボタンを押します。

<img src="./image/pdbsum1.png">
![PDBsum top page](./image/pdbsum1.png)

すると、PDB ID: 1ALKについてのページに移ります。このトップページには構造の図とともに、タンパク質の分類・リガンド情報・化学反応・一次文献情報・この構造を引用している論文一覧……などが表示されています。

<img src="./image/pdbsum2.png">
![PDBsum ID 1ALK page](./image/pdbsum2.png)

さらに、上部にあるタブをクリックすることで、さらに他の詳細な情報を表示させることができます。ここではProteinタブをクリックしてみましょう。

<img src="./image/pdbsum3.png">
![PDBsum Protein tab](./image/pdbsum3.png)

Proteins タブ、ページ左側にあるMotifsメニューのSecondary structure, Residue conservationをクリックすると(上図の赤丸部分)、アミノ酸の生物種間での保存度が1つずつカラーリングされているページが現れます。

<img src="./image/pdbsum4.png">
![PDBsum Motifs menu](./image/pdbsum4.png)

<img src="./image/pdbsum5.png">
![PDBsum Residue conservation](./image/pdbsum5.png)

この1文字表記のアミノ酸配列を見てみると、青〜緑〜黄〜赤までのカラーリングがなされていることに気づくと思います。**このカラーリングはこの大腸菌アルカリホスファターゼの類縁配列上で、そのアミノ酸の位置がどれほど保存されているかを表しています**(ページ下部に説明が書かれてあります)。言い換えれば、大腸菌アルカリホスファターゼについて他の類縁配列とのマルチプルシーケンスアライメントを作成してみたとき、ある位置のアミノ酸の種類が他の類縁配列上でも同じであればその位置のアミノ酸の保存度は高く、逆に他の類縁配列上でバラバラな様子が観測されていればその位置のアミノ酸の保存度は低くなります。例えば、この大腸菌アルカリホスファターゼのcatalytic residueである**Ser102**, **Arg166**のアミノ酸の保存度は最も高い9で示されています。この他にも、**PDB SITE records**(※なにかのリガンドが結合しているアミノ酸につくレコード)のマークが付いているアミノ酸はいずれも高い保存度を示していることが見て取れます。しかし、大腸菌アルカリホスファターゼのアミノ酸配列全体を見渡してみると、他にも保存度が高いところがあるのが伺えますし、逆に保存度が低いアミノ酸はなぜ低くなっているのか、という疑問も残ります。

そこでこの疑問を考察するために、これからこの保存度の情報をPyMOLで表示させた大腸菌アルカリホスファターゼ構造の上に表示させてみます。

先程のResidue Conservationのページの下の方を見ると、この保存度は**Consurf-DB**というデータベースに保存されてあります([https://consurfdb.tau.ac.il/](https://consurfdb.tau.ac.il/) )。このページにアクセスして、大腸菌アルカリホスファターゼのPDB IDとChain IDを以下の画像のように入力してみましょう。

<img src="./image/consurfdb1.png" width="80%">
![Consurf-DB input](./image/consurfdb1.png)

すると、まもなくPDB: 1ALKについての保存度情報についてのページに遷移します。ここで、下の方にある**High Resolution Figures**のところから、PyMOLの方のマークをクリックして、PyMOLのセッションファイル(`consurf_pymol_session.pse`)をダウンロードします。

<img src="./image/consurfdb2.png">
![Consurf-DB High Resolution Figures](./image/consurfdb2.png)

このダウンロードしてきたファイルをPyMOLで開いてみましょう。

<img src="./image/consurfdb3.png">
![Consurf-DB PyMOL session](./image/consurfdb3.png)

ここで、保存度のカラーリングはChain Aのみに行われており、Chain Bについては情報が存在していないためグレー表示となっていることに注意してください。

Expand Down
30 changes: 15 additions & 15 deletions src/ch01/download.md
Original file line number Diff line number Diff line change
@@ -1,26 +1,26 @@
## PDBデータのダウンロード

PDBの構造情報ファイルをダウンロードし、その中身を確認してみましょう。

**分子の立体構造データ**の実体は、**その分子を構成している各原子の\\( xyz \\)座標データの集まり**です。PDB ID: 1ALKのStructure Summaryのタブに戻って右上の**Display Files**を左クリックし、さらに**PDB Format**を左クリックすると、開かれたタブの中にPDBデータの中身が表示されます。

最初に`HEADER`レコードや`REMARK`レコード、`SEQRES`レコードなどのヘッダ部があり、下方の`ATOM`(あるいは`HETATM`)レコードに分子を構成する各原子の\\( xyz \\)座標などが並んでいます。ヘッダ部には、この分子が由来する生物種や文献情報、構造決定方法に関する情報、アミノ酸配列、単量体か多量体か、構造中に含まれる金属や補酵素の情報などが書かれており、先程まで見ていたPDB ID: 1ALKのウェブページ上ではこれらの情報がわかりやすく整形されて表示されています。座標データは、20種類の標準アミノ酸は`ATOM`レコードに、それ以外の基質や金属、修飾アミノ酸などは`HETATM`レコードに記述されています。1ALKの`ATOM/HETATM`レコードに、タンパク質のAチェイン、 Bチェイン、続いて亜鉛(`ZN`)、マグネシウム(`MG`)、リン酸(`PO4`)、水分子(`HOH`)の座標データが並んでいることを確認してみましょう。


```
HEADER: PDB IDやタンパク質の種類,データ登録年月日
TITLE: このデータを得た研究内容の簡単な説明
SOURCE: その分子の由来(遺伝子名,生物種など)
AUTHOR: 著者名
JRNL: 立体構造が発表された文献情報
REMARK: X線結晶解析の解像度やその他のコメントなど
SEQRES: アミノ酸・塩基配列
HET: 標準アミノ酸・塩基以外の金属原子,基質などの情報
HEADER: PDB IDやタンパク質の種類,データ登録年月日
TITLE: このデータを得た研究内容の簡単な説明
SOURCE: その分子の由来(遺伝子名,生物種など)
AUTHOR: 著者名
JRNL: 立体構造が発表された文献情報
REMARK: X線結晶解析の解像度やその他のコメントなど
SEQRES: アミノ酸・塩基配列
HET: 標準アミノ酸・塩基以外の金属原子,基質などの情報
HELIX/SHEET/TURN: 2次構造情報
SSBOND: ジスルフィド(S-S)結合
ATOM: 原子座標など
HETATM: アミノ酸やヌクレオチド以外の原子(金属,基質化合物など)の座標など
TER: チェイン(chain, 鎖)の終わり
END: エントリの終わり
SSBOND: ジスルフィド(S-S)結合
ATOM: 原子座標など
HETATM: アミノ酸やヌクレオチド以外の原子(金属,基質化合物など)の座標など
TER: チェイン(chain, 鎖)の終わり
END: エントリの終わり
```

なお、構造ファイルのデータフォーマットは、これまで伝統的に用いられてきた**PDB format**に代わって、2019年7月1日からは**PDBx/mmCIF format**が標準形式として採用されることになっています。このファイル形式は、人間にはわかりにくいがコンピュータで処理しやすい形式になっています。余裕があればこのフォーマットも新規タブで開いてみましょう。
Expand All @@ -31,4 +31,4 @@ END: エントリの終わり

<img src="./image/rcsbpdb_down.png" width="250px">

ここで、ファイル名を`1alk.pdb`とします。PDBファイルが`ダウンロード`のフォルダにダウンロードされるので、そこから`デスクトップ`にファイルを移動させます。
ここで、ファイル名を`1alk.pdb`とします。PDBファイルが`ダウンロード`のフォルダにダウンロードされるので、そこから`デスクトップ`にファイルを移動させます。
Loading

0 comments on commit cbb716b

Please sign in to comment.