BLOSUM打分矩阵
目录
BLOSUM打分矩阵
在生物信息学中,BLOSUM打分矩阵矩阵是一种用于蛋白质序列比对的替代矩阵。 BLOSUM 打分阵矩阵用于对进化上不同的蛋白质序列之间的比对进行评分。 它们基于局部排列。 他们在 BLOCKS 数据库中扫描了蛋白质家族中非常保守的区域(在序列比对中没有间隙),然后计算了氨基酸的相对频率及其替换概率。 然后,他们计算了 20 种标准氨基酸的 210 种可能替代对中每一种的对数比分。 所有的 BLOSUM 打分阵矩阵都是基于观察到的排列; 它们不是从 PAM 矩阵等密切相关的蛋白质的比较中推断出来的。
生物学背景
活生物体中每个复制细胞的遗传指令都包含在其 DNA 中。 在细胞的整个生命周期中,这些信息通过细胞机制进行转录和复制,以产生蛋白质或在细胞分裂过程中为子细胞提供指令,并且 DNA 有可能在这些过程中发生改变。 这被称为突变。 在分子水平上,有一些调节系统可以在 DNA 复制之前纠正大部分(但不是全部)这些 DNA 变化。
蛋白质的功能高度依赖于它的结构。 改变蛋白质中的单个氨基酸可能会降低其执行此功能的能力,或者突变甚至可能会改变蛋白质执行的功能。 像这样的变化可能会严重影响细胞的关键功能,可能导致细胞——在极端情况下,甚至是有机体——死亡。 相反,这种变化可能会让细胞继续发挥作用,尽管有所不同,并且突变可以传递给生物体的后代。 如果这种变化不会对后代造成任何明显的身体缺陷,则这种突变可能会在种群中持续存在。 也存在功能变化变得有利的可能性。
由遗传密码翻译的 20 种氨基酸因其侧链的物理和化学特性而有很大差异。 然而,这些氨基酸可以归类为具有相似物理化学性质的组。 与用不同类别的氨基酸置换相比,用同类氨基酸置换另一种氨基酸对蛋白质结构和功能的影响可能更小。
序列比对是现代生物学的基础研究方法。 蛋白质最常见的序列比对是寻找不同序列之间的相似性,以推断功能或建立进化关系。 这有助于研究人员通过同源性和保守性的本质更好地了解基因的起源和功能。
术语
评分指标(统计与生物学):在评估序列比对时,人们想知道它有多有意义。 这需要一个评分矩阵,或一个值表,用于描述比对中出现具有生物学意义的氨基酸或核苷酸残基对的概率。 每个位置的分数是在蛋白质序列的局部比对块中获得的替换频率。
存在几组 BLOSUM 打分矩阵矩阵,使用不同的比对数据库,以数字命名。
BLOSUM打分阵矩阵,高数设计用于比较密切相关的序列,而低数设计用于比较远距离相关序列。 例如,BLOSUM打分阵80用于关系较近的比对,BLOSUM打分阵45用于关系较远的比对。 这些矩阵是通过将所有比给定百分比更相似的序列合并(聚类)到一个序列中,然后只比较这些序列(比给定百分比值更不同)来创建的; 从而减少密切相关序列的贡献。 使用的百分比附加在名称后,给出 BLOSUM 打分阵 80 例如,其中超过 80% 相同的序列被聚类。