基因组中重复序列的意义 生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出62616964757a686964616fe58685e5aeb931333433653939发,分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析,也就是研究新的计算机方法,从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中,将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定,拼接,基因的表达分析,到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。基因组中由寡核苷酸串联,重复排列的DNA序列,构成数量可变的串联重复序列,其中,微卫星DNA又称为短串联重复片列,是一种可遗传的不稳定的且具有高度多态性的短核苷酸重复序列,具有种类多,分布广,高度多态性等特点,这种多态性标志已广泛用于遗传病及亲子鉴定等.短序列比对中,一般常用的算法主要有三个:(1)空位种子片段索引法,首先将读段切分,并选取其中一段或几段作为种子建立搜索索引,再通过查找索引、延展匹配来实现读段定位,通过轮换种子考虑允许出现错配)的。
对于基因的重复片段,主要作用是用来强化表达的吗? 大型动物可以长得很大,是否也主要是重复片段的功劳?如果是,此外还有那些基因类型会影响生物块头大小?
4. 人类基因组中存在着重复单位为2~6bp的重复序列,称为: 微卫星2113DNA微卫星DNA:重复单位序列5261最短,只有2~6bp,串联成簇,长度50~100bp,又4102称为短串联重1653复序列(Short Tandem Repeat STR)。广泛分布于基因组中。其中富含A-T碱基对,是在研究DNA多态性标记过程中发现的。1981年Miesfeld等首次发现微卫星DNA,其重复单位长度一般为1~6个核苷酸,双核苷酸重复单位常为(CA)n和(TG)n。