:单核苷酸多态性(SNPs)是人类遗传变异中最显著的一种形式,是一个物种中DNA 序列中某个位点上的碱基变化。人们发现由单核苷酸组成的单体型比单一的单核苷酸包含更多的生物遗传信息,因此研究单体型对于诊断疾病和药物研制有着重要作用。单体型重建就是对由SNP 片段组成的基因片段进行组装,从而构造出原来的一对单体型。本文在k 最近邻和粒子群算法的基础上,提出一种解决单体型重建问题的一种聚类算法。最后,本文将用模拟数据和真实数据来检验本文所提出的算法,结果证明所提出的算法可行。
随着人类基因组图谱的基本完成[1],人们对遗传的差异性、由基因突变引起的疾病复杂性有了更精确的阐释[2]。现在人们普遍认为,DNA 序列中少数的差异是导致遗传疾病的主要原因。单核苷酸多态性(SNPs),DNA 某一位置碱基的变化[3],被认为是一个物种不同个体表型的主要遗传来源[4]。研究SNPs 对 基因的研究、遗传疾病的诊断和药物研制有着重要作用。人类的DNA 序列是按染色体成对出现的,每一条染色体上SNP 位点上的碱基序列叫做单体型, 所以人类等二倍体生物都有一对单体型。在医学研究中, 单体型数据通常比单个SNP 携带更多的信息。
基于单体型在遗传分析上的重要性,现在人们较为关注的是单体型的检测问题。
Copyright © 2012 Hanspub 17