法医学STR基因座命名规范
1范围
本技术规范规定了法医学常见STR基因座的命名原则及要求。
2术语和定义
下列术语和定义适用于本文件。
2.1
短串联重复序列short tandem repeats, STR
存在于人类基因组DNA中的一类具有长度多态性的DNA序列,由2-6个碱基的重复单位串联构成,是目前法医物证鉴定中应用最广泛的遗传标记。
2.2
等位基因allele
同一个基因座上的基因可以有多个,它们之间存在DNA一级结构的差异,这种有差异的基因互称为等位基因。
2.3
微变异等位基因/中间等位基因microvariant allele/ intermediate allele
基因座上表现为含有不完全重复单位的等位基因。
2.4
基序motifol是什么单位
STR基因座核心序列重复单位碱基的组成形式。
2.5
简单序列simple repeats
重复单位长度和碱基组成基本一致的DNA序列。
2.6
复合序列compound repeats
由两种或两种以上的重复单位组成,但重复单位的长度基本一致的DNA序列。
2.7
复杂序列complex repeats
存在序列差异和长度差异的DNA序列。
3STR基因座的命名
3.1基因座的命名
基因座的命名有以下两种方式:
a)按照Genome Database (GDB)命名原则,以基因座所在染体以及首次进入公共数据库的原始
序号为依据进行命名,记录为D#S##,其中字母D表示DNA,S代表单拷贝序列,D与S之间的数字代表所在的染体序号,S之后的数字表示该染体上发现并进入公共数据库的序
号。该命名方式主要适用于非编码区中的STR基因座或染体定位不明的STR基因座。例如,D3S1359是指位于人类3号染体上入库数据中第1359号序列。
b)按照STR序列的GenBank注册命名。该命名方式主要适用于位于蛋白编码基因及其内含子和
假基因的STR基因座。例如,人类α-纤维蛋白原基因第3内含子中的STR序列命名为FGA。
3.2等位基因的命名
3.2.1DNA链的选择及核心重复单位的确定
法医学常见STR基因座的基序结构参见附录A。
DNA链的选择及核心重复单位的确定原则如下:
a)以D#S##命名的基因座,针对第一个进入公共数据库的文献报道的原始序列确定重复单位构
成;
b)蛋白编码区域(包括内含子)的STR基因座选用编码链确定重复单位;
c)未在附录A提供的STR基因座的重复单位序列确定宜采用人类参考序列Hg 19 或GRCh38进行
序列比对,且采用正向链进行比对;
d)重复序列应从离5'端最近的一个核苷酸开始定义;
e)已建立的与上述原则不一致的重复单位序列仍予以保留。
3.2.2基于长度多态性检测结果的命名
按照重复单位的重复次数进行命名。例如,基因座D13S317的某等位基因重复单位的重复次数与同步电泳的Ladder比对后为12,则该等位基因命名为12。
对于微变异等位基因,其命名是在完整重复单位的重复次数后用一小数点分隔,然后再记录不完整重复单位的碱基数。
对于“off-ladder”(OL)等位基因,可通过参照内标计算每个带有实际分子量标的信号峰的位置来进行命名。例如,样本在D6S1043基因座的第一个信号峰是显示为OL等位基因,落入bin 12~13,第二个信号峰是等位基因14。计算方法可参见图1,其中,样本的等位基因14与Ladder的等位基因14的大小差值是0.12 nt,OL等位基因与等位基因13的差值是1.13 nt,则OL等位基因峰相对偏移为1.01nt,可判断OL等位基因比等位基因13少一个核苷酸,属于微变异等位基因,应命名为12.3。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论