字符集合
只是一些非控制型字符,象空格和结束符,出现在PDB文件记录中。也就是:
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
1234567890
` - = [ ] \ ; ' , . / ~ ! @ # $ % ^ & * ( ) _ + { } | : " < > ?
空格和结束符。结束符根据系统而定,Unix用一行字符,而其他的系统可能就用一个回车来表示。
特殊字符
希腊字母就详细的拼写出来。比如:α, β, γ
原子用DOT表示。
右箭头用-->表示。
左箭头用<--表示。
上标用两个等号表示开始和结束。比如:S==2+==
下标用一个等号来表示开始和结束。比如:F=c=
如果等号两边至少有一边有一个空格,那么这个字符就是表示等号。比如:2 + 4 = 6
逗号,冒号和括号用来表示文档中的分界苻,也就是下面几种中的一种:
List
SList
Specification List
Specification
如果逗号,冒号或者括号在任何一片文档中使用不是作为分界苻的话,那么肯定有字符被漏掉了。比如下边例子中第四行的"\":
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: GLUTATHIONE SYNTHETASE;
COMPND 3 CHAIN: NULL;
COMPND 4 SYNONYM: GAMMA-L-GLUTAMYL-L-CYSTEINE\:GLYCINE LIGASE
COMPND 5 (ADP-FORMING);
COMPND 6 EC: 6.3.2.3;
COMPND 7 ENGINEERED: YES
COMPND MOL_ID: 1;
COMPND 2 MOLECULE: S-ADENOSYLMETHIONINE SYNTHETASE;
COMPND 3 CHAIN: A, B;
COMPND 4 SYNONYM: MAT, ATP\:L-METHIONINE S-ADENOSYLTRANSFERASE;
COMPND 5 EC: 2.5.1.6;
COMPND 6 ENGINEERED: YES;
COMPND 7 BIOLOGICAL_UNIT: TETRAMER;
COMPND 8 OTHER_DETAILS: TETRAGONAL MODIFICATION
数据类型-------------------------------------
该部分该部分主要用来描述试验和记录中该大分子的一些基本信息,有
以下几种记录:
HEADER,OBSLTE,TITTITLE,CAVEAT,COMPND,SOURCE,KEYWDS,EXPDTA,
AUTHOR,REVDAT,SPRSDE,JRNL和REMARK部分。以下来具体说明一下各个记录。
记录类型--------------------------------------
按照在记录中出现的频率区分:
SINGLE
一个文件中只出现一次.按字母顺序列出如下:
记录类型 说明
CRYST1 晶胞参数
END 结束
HEADER 分子类,公布日期,ID号
MASTER 版权拥有者
ORIGXn 直角-PDB坐标
SCALEn 直角部分结晶学坐标
如果这些记录在一个记录中重复出现是错误的。
SINGLE CONTINUED
在记录中概念性的只出现一次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:
记录类型 说明
AUTHOR 结构测定者
CAVEAT 可能的错误提示
COMPND 化合物名称
EXPDTA 测定结构所用的试验方法
KEYWDS 关键词
OBSLTE 注明该id号已改为新号
SOURCE 化合物来源
SPRSDE 已撤消或更改的相关记录
TITLE 说明试验方法类型 朋友圈拜年文案
MULTIPLE
大部分记录类型多次出现,经常出现在这些组中,组中的信息理论上并没有连接,但已呈现为列表的组成部分.这种记录类型中的许多习惯连载可能不仅仅制定记录还和其他记录相联.按字母顺序列出如下:
记录类型 说明
ANISOU 温度因子
ATOM 标准基因的原子坐标
CISPEP 顺势残基
CONECT 有关记录
DBREF 其他序列库的有关记录
HELIX 螺旋
HET 非标准残基
HETSYM 非标准残基的同义字
HYDBND 氢键
LINK 残基间化学键
MODRES 对标准残基的修饰
MTRIXn 显示非晶相对称
REVDAT 修订日期及相关内容
SEQADV PDB和其它记录的出入
SEQRES 残基序列
SHEET 片层
SIGATM 标准差
SIGUIJ 温度因子
SITE 特性位点
SLTBRG 盐桥
SSBOND 二硫键
TURN 转折
TVECT 转换因子
Multiple Continued
在记录中概念性的出现多次,但信息内容可能超过了可利用列的数目.因次这些记录在后来的排列中会继续.按字母顺序列出如下:
记录类型 说明
FORMUL 非标准残基化学式
HETATM 非标准集团原子坐标
HETNAM 非标准残基的化学名称
Grouping
有三种记录类型用来聚合其他记录. 按字母顺序列出如下:
记录类型 说明
ENDMDL 亚基结束
MODEL 多亚基时,示亚基号
TER 链末端
MODEL/ENDMDL 记录包围着 ATOM, HETATM, SIGATM, ANISOU, SIGUIJ,和 TER 记录. TER 记录预示链的末端.
Other
其他记录类型有详细的内部结构.按字母顺序列出如下:
记录类型 说明
JRNL 发表坐标集的文献
REMARK 注解
记录的表示 PDB数据库中的数据都应按照一定的规定来出现,强制记录类型必须出现在所有的记录中,当强制数据没有提供,记录名必须出现在记录中并以NULL表示当此条件存在时选择项表就变成强制记录类型。以下表格是对这两种类型的具体划分和描述:
记录部分的划分
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
对数据类型的说明
残基名字 在PDB格式中出现的标准残基的名字:
Appendix 4中有更多关于标准残基名和缩写的信息, Appendix 5中有他们的化学式和分子量. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
标题部分
HEADER(分子类,公布日期、ID号)
综述
该记录包含三个方面的内容:蛋白质的种类,被该数据库接收的日期和唯一区分该蛋白质的id CODE.
记录格式
列 | 数据类型 | 字段名称 | 定义描述 |
1 – 6 | Record name | "HEADER" | |
11 – 50 | String(40) | classification | 该蛋白质的分类 |
51 – 59 | 家里潮湿怎么办Date | depDate | 被数据库接收的日期 |
63 – 66 | IDcode | idCode | 唯一标识某个蛋白 |
细节
改分类表示是左对齐的,并且由于分给字符位的限制,有时分类名太长,要用简写表示。在KEYWDS记录中存着改分类的全称。
示例
1 2 3 4 5 6 7
1234567891234567891234567891234567890
HEADER MUSCLE PROTEIN 02-JUN-93 1MYS
HEADER HYDROLASE (CARBOXYLIC ESTER) 08-APR-93 2PHI
HEADER COMPLEX (LECTIN/TRANSFERRIN) 07-JAN-94 1LGB
1234567891234567891234567891234567890
HEADER MUSCLE PROTEIN 02-JUN-93 1MYS
HEADER HYDROLASE (CARBOXYLIC ESTER) 08-APR-93 2PHI
HEADER COMPLEX (LECTIN/TRANSFERRIN) 07-JAN-94 1LGB
OBSLTE (注明此ID号已改为新号)
综述
该记录出现在已经被收回的蛋白质的描述中,可以作为一个标志。任何新的记录都能代替别回收的记录.这个版本允许多个新纪录代替现有记录.
记录格式
列 | 数据类型 | 字段名称 | 定义描述 |
1 – 6 | Record name | "OBSLTE" | |
9 – 10 | Continuation | continuation | 允许多重记录串联表示不同行的顺序号 |
12 – 20 | Date | repDate | 被替代的日期 |
22 – 25 | IDcode | idCode | 该记录的id code |
32 – 35 | IDcode | rIdCode | 替换的id code |
37 – 40 | IDcode | rIdCode | 替换的id code |
42 – 45 | IDcode | rIdCode | 替换的id code |
47 - 50 | IDcode | rIdCode | 替换的id code |
52 - 55 | IDcode | rIdCode | 替换的id code |
57 – 60 | IDcode | rIdCode | 替换的id code |
62 – 65 | IDcode | rIdCode | 替换的id code |
67 – 70 | IDcode | rIdCode | 替换的id code |
细节
只有第一个提交记录的人才有权利收回改蛋白质,所有回收的记录都有研究用途.
示例
1 2 3 4 5 6 7
1234567891234567891234567891234567890
OBSLTE 31-JAN-94 1MBP 2MBP
1234567891234567891234567891234567890
OBSLTE 31-JAN-94 1MBP 2MBP
TITLE(说明实验方法类型)
综述
该记录描述试验的题目或者对它的一些分析。该记录唯一区分一个蛋白质。
记录格式
列 | 数据类型 | 字段名称 | 定义描述 |
1 - 6 | Record name | "TITLE " | |
9 - 10 | Continuation | 顺序 | 允许多重记录串联表示不同行的顺序号 |
11 - 70 | String | 标题 | 试验题目 |
细节
1. 描述记录内容和区别相似记录得程序或条件,使录入者有机会着重强调做这些特殊试验得根本目的.
2. TITLE可能包括得一些项目: -实验类型
-对突变的描述
-记录中只给出α-碳原子.
-对突变的描述
-记录中只给出α-碳原子.
示例
1 2 3 4 5 6 7
1234567891234567891234567891234567890
TITLE RHIZOPUSPEPSIN COMPLEXED WITH REDUCED PEPTIDE INHIBITOR
TITLE BETA-GLUCOSYLTRANSFERASE, ALPHA CARBON COORDINATES ONLY
CAVEAT(可能的错误提示)
综述
警告在蛋白质记录中中出现的错误。
记录格式
列 | 数据类型 | 字段名称 | 定义描述 |
1 - 6 | Record name | "CAVEAT" | |
9 - 10 | Continuation | continuation | 允许多重记录串联表示不同行的顺序号 |
12 - 15 | IDcode | idCode | 蛋白质的ID code |
20 - 70 | String | comment | 警告的原因 |
细节
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论