收藏本站 | 论文目录

关键词: python matlab plc 单片机 dsp fpga 仿真 stm32

基于Cappella分布式文件系统的元数据聚类研究与实现

[关键词:Cappella,分布式文件系统,元数据聚类]  [热度 ]
提示:此毕业设计论文完整版包含【论文
作品编号:ckjs0065,word全文:40页,合计:20000

以下仅为该作品极少介绍,详细内容请点击购买完整版!
基于Cappella分布式文件系统的元数据聚类研究与实现毕业设计论文------

本文主要工作

由于元数据的海量性,传统的聚类算法不能很好的适用于元数据的聚类,结合Cappella分布式文件系统元数据的特点,维度灾难(curse of dimensionality)[8]不是考虑的首要因素,应从聚类算法的复杂度入手来实现元数据的聚类算法。本文主要的工作为元数据聚类方法的研究与实现。设计与实现了一种基于抽样的元数据聚类算法,最后利用Cappella分布式文件系统的元数据,完成聚类。

在上述整体思路下,本文所涉及的工作主要包括几个方面:

1. 分析了当前分布式文件系统存在的问题,提出了解决问题的方法,得出了元数据聚类的目的和意义,调研了聚类算法的发展以及国内外的研究情况,寻找一个适合于元数据聚类的算法。

2. 学习了分布式文件系统的概念,着重理解了Cappella分布式文件系统的设计理念,分析其元数据的特点。

3. 设计并实现了一种基于抽样的元数据聚类算法,并结合Cappella分布式文件系统加以实现,并通过实际的测试分析对算法的有效性和时间开销进行了分析。

本文主要结构

本文共分为六章,各个章节所涉及到的主要内容如下:

第一章:介绍了本文的研究背景,分析了对元数据进行聚类的目的和意义;接着介绍了当前分布式文件系统的研究现状,以及目前聚类算法的研究情况,得出传统聚类算法无法解决海量数据的聚类,从而提出一种基于抽样的元数据聚类算法来解决元数据的聚类。

第二章:介绍了分布式文件系统的概念,对分布式文件系统的发展历程进行了简单梳理;接着介绍了三个分布式文件系统:GPFS、Lustre和GPFS,然后对Cappella分布式文件系统的设计思路进行了详细的阐述;最后对现阶段元数据研究的特点进行了简单分析。

第三章:对元数据聚类算法的整体设计进行了介绍,分别对抽样,聚类,均值更新和数据划分所用到的方法进行了详细的阐述,然后对元数据聚类算法进行了理论分析和复杂度分析。

第四章:详细阐述了元数据聚类的实现细节,介绍了元数据信息获取的方法,接着对元数据抽样,Single聚类算法,均值更新和数据划分所用到的算法过程进行了详细的介绍。

第五章:为测试部分,介绍了进行测试的测试环境,对本文使用的评价指标做了详细的解释。接着对本文实验所使用的实验方案进行了描述,基于实验结果,做了进一步的分析。

第六章:对本文所做的工作进行了总结,并对以后本文可以继续深入研究的方面做出了期望。

 

 


以上仅为该作品极少介绍,详细内容请点击购买完整版!

提示:此毕业设计论文完整版包含【论文
作品编号:ckjs0065,word全文:40页,合计:20000

本测控技术与仪器毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——基于Cappella分布式文件系统的元数据聚类研究与实现(论文)!
相关毕业设计
    没有关键字相关信息!