收藏本站 | 论文目录

关键词: python matlab plc 单片机 dsp fpga 仿真 stm32

当前位置: 毕业论文设计参考 >> 其它专业论文 >> 软件工程本科论文

基于基因本体的基因功能相似性度量

[关键词:基因,本体,基因功能]  [热度 ]
提示:此毕业设计论文完整版包含【论文,源程序,答辩稿
作品编号:rjgc0378,word全文:42页,合计:16000

以下仅为该作品极少介绍,详细内容请点击购买完整版!
基于基因本体的基因功能相似性度量毕业设计论文------

本文以两个基因注释集合的交集的信息量作为该对基因的共享语义,并结合继承语义和拓展语义的概念,在此基础上提出一种新的衡量基因功能相似性的算法——注释的语义重叠比(Semantic Overlap Ratio of Annotation,SORA)。此外,考虑到基因本体中存在多重继承,本文对原始SORA算法做出修改,在计算继承信息量时乘以由被拓展集合中的条目数量和拓展条目的祖先数量确定的比例因子。

最后,本文以致病基因作为测试数据,对原始及修改后的SORA算法进行了验证,实验结果说明本文实现的算法能有效刻画基因的相似性。

本文剩余章节安排如下:

第二章介绍了本文需要用到的基础知识,包括GO概述、基因注释,并对目前基因功能相似性的衡量方法进行分类叙述,其中介绍了几种经典的算法,并分别进行了分析。

第三章详细介绍SORA算法,首先讨论单个条目的信息量的计算方法,接着阐述该算法之所以提出所针对的问题,继而引出继承和拓展信息量的概念,再以此为基础,提出计算条目集合信息量的算法。由于这一部分是SORA算法的核心,所以将以较多的篇幅进行详细叙述,并通过一个具体的例子展示算法的执行流程。最后以集合信息量为基础,提出衡量基因的功能相似性的方法。

第四章叙述SORA算法的实现以及对该算法的测试评估。首先对实现语言R和算法实现过程中使用到的包进行介绍,然后对算法实现时所划分的各个模块进行详细叙述,最后通过以致病基因为测试数据进行测试,验证了算法的合理性。

第五章对整篇论文进行总结,提出了SORA算法可以被其他算法借鉴的地方,以及后续可改进的方面,最后展望了基因功能相似性衡量方法的前景。

......

本文在SORA算法中考虑到基因本身的信息量以及浅注释的问题对衡量基因相似性产生的影响,提出一种新的方式来比较基因相似性。此外,考虑到GO条目并非是以“树”的形式构建,而是以有向无环图的方式,这意味着GO条目间会有多重继承,因此本文还将对SORA算法提出一些修改,使其更加合理。之后通过以致病基因为测试数据进行实验,验证了SORA算法的合理性。

SORA算法作为一种成组比较基因相似性的方法,具有以下三种特性:首先,在计算条目的信息量时,避免了条目受到注释语料库的影响,以条目在GO图中的特性为基础,考虑到specificity和coverage两个因素,具体而言,即条目在GO图中的深度和其后代条目的数量,比只考虑一个因素的方法更能体现不同条目间信息量的差异性,也能客观地体现条目的语义。其次,通过计算条目的继承和拓展信息量,有效地避免了一个基因集合中条目成员间共享语义的重复计算,这也是SORA算法的核心所在。最后,以两个基因注释集合的交集的信息量占各基因注释集合信息量的比值的平均值衡量为两个基因的相似性,与成对比较的方法相比,更考虑到了一个基因的注释条目间的联系。实验数据也显示该算法能够合理地刻画基因的相似性。

SORA算法可与其他算法融合,比如GraSM算法中以两个条目的分离公共祖先(Disjunctive Common Ancestor,DCA)的IC的......

 

 


以上仅为该作品极少介绍,详细内容请点击购买完整版!

提示:此毕业设计论文完整版包含【论文,源程序,答辩稿
作品编号:rjgc0378,word全文:42页,合计:16000

本软件工程毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——基于基因本体的基因功能相似性度量(论文,源程序,答辩稿)!