基于人类表型本体的语义相似性研究
[关键词:人类表型,本体,相似性] [热度 ]提示:此毕业设计论文完整版包含【论文,源程序,答辩稿】 作品编号:rjgc0372,word全文:44页,合计:16000字 |
本文主要研究了基于人类表型本体(Human Phenotype Ontology,HPO)数据的语义相似性分析方法,并构建了两个R 语言软件包:HPO.db 和 HPOSim。
文中首先介绍了 HPO 的数据结构及 HPO.db 数据包的构建过程,接着着重介绍了集成在 HPOSim 中的两种基于边的相似性算法的设计及实现,以及 R 语言中对于循环的相关优化方法。
最后,使用 HPO 数据对 HPOSim 包中的相似性算法进行了测试。实验结果表明,文中提出的用于计算疾病或基因之间的相似性的方法是可行的。
通过对已有的 GO 和 DO 的数据包 GO.db 和 DO.db 以及工具包 GOSim 和
DOSim[9]包的研究,将其中的经典语义相似性算法用于 HPO 上。
在已有的旧版的 HPO 的数据包 HPO.db 的基础上,通过 HPO 的官网下载新的 HPO 数据,并将这些数据进行预处理,对 HPO.db 数据包进行更新。HPO.db数据包先通过使用 SQLite 来进行数据处理,再使用 Rtools 工具将其进行打包。在 HPO.db 包的基础上,同时对 HPOSim 包中的数据进行更新,设计并实现
基于边的最短路径的语义相似性算法,并将相似性算法集成入HPOSim 软件包。利用 HPO.db 中的数据对语义相似性算法的效果进行验证。
章节安排
本文剩余章节安排如下:
第二章介绍文章中所涉及的相关理论和使用工具。
第三章详细介绍了 HPO 的数据包 HPO.db 包的结构及构建方法,并给出了更新 HPO.db 包的详细步骤。
第四章详细介绍 HPO 中的工具包 HPOSim 包中的结构以及新加入的相似性算法及使用方法。
第五章对 HPOSim 包进行了关联性 HPO 条目的非关联性 HPO 条目的实验, 选取了具体的OMIM 中的部分 HPO 条目计算其相似性并对结果进行分析。
本文使用 R 语言为工具,将 HPO 官方提供的 OBO 格式的数据进行处理,制作了两个 R 语言软件包:数据包 HPO.db 和工具包 HPOSim。
在 HPO.db 包中,主要是对现有的 HPO 数据进行整理,将其中的条目、继承关系等进行了整理,使之能被方便的调用。使用 HPO.db 包可以很便捷的查询到某个条目的父亲节点、孩子节点、祖先节点和后代节点,还有条目本身携带的信息。同时,本文所提供的 HPO.db 的更新方法适用于 Windows 平台,可供将来更新 HPO.db 的工作提供参考。
而工具包 HPOSim 包则是在 HPO.db 的基础上,用于计算表型间相似性和基因或疾病相似性的工具包。本文中所提及的两种相似性算法是作者新加入HPOSim 包中的两种基于边的相似性算法。除此之外,在新的HPOSim 包中仍然还包含了原本实现的基于点的相似性算法。由于 HPO.db 的更新,HPOSim 包中所携带的数据也在此次进行了更新。除了更新数据之外,同时也将原本代码中存在的问题进行了修改优化,使之能正确快捷的处理数据。
提示:此毕业设计论文完整版包含【论文,源程序,答辩稿】 作品编号:rjgc0372,word全文:44页,合计:16000字 |
本软件工程毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——基于人类表型本体的语义相似性研究(论文,源程序,答辩稿)!