用C++面向对象技术实现复杂生物网络集存储

发布日期:2011 年9 月23 日
用C++面向对象技术实现复杂生物网络集存储 用C++面向对象技术实现复杂生物网络集存储

本内容试读结束

下载后可阅读完整内容,立即下载

:高通量生物技术的发展涌现出了海量的生物网络数据。如何有效的从复杂的生物网络集中挖掘出保守的频繁模式是当代系统生物学研究的热点问题之一。由于生物数据规模大、维数高等的原因,开发出从复杂生物网络集中挖掘出保守频繁模式的应用软件往往面临着一个存储表示的难题。本文用C++面向对象的相关技术,研究了生物网络集的存储表示,并在文中最后讨论了该方法在频繁模式挖掘中的应用。

近年来,随着DNA 测序技术和高通量技术的发展,生物学研究的热点已经逐步把分子生物学推入到系统生物学时代。生物网络作为一种描述生物分子间相互作用关系的研究模型,在揭示生物体的生长、发育、衰老和疾病等生命系统的基本分子过程和规律中受到越来越多的重视[1-4]。

生物网络主要包括基因调控网络、蛋白质网络、代谢网络及信号传导网络。由于生物系统通常具有保守性,利用网络集中的频繁模 式挖掘可以排除生物数据中的各种干扰, 挖掘出有生物意义的模式。

通常, 共表达网络中的频繁稠密子图可能表示一簇紧密的共表达聚类, 通过这种方法得到的基因簇可以进行基因功能的注释和疾病基因的发现等。

鉴于这一研究的重要性,很多生物信息学家开发出了一些应用软件,如CODENSE[5]、NeMo[6]等。传统的邻接矩阵或邻接表方法在处理大规模网络集(网络数在几十到上百,基因个数在5000~10,000)时在时间和空间方面都存在很大的局限,本文用C++面向对



相关标签