收藏本站 | 论文目录

关键词: python matlab plc 单片机 dsp fpga 仿真 stm32

当前位置: 毕业论文设计参考 >> 电子电气通信 >> 通信工程本科论文

特征选择算法研究

[关键词:特征选择算法]  [热度 ]
提示:此毕业设计论文完整版包含【论文
作品编号:txgc0965,word全文:53页,合计:21000

以下仅为该作品极少介绍,详细内容请点击购买完整版!
特征选择算法研究毕业设计论文------

本文共有五章内容。

第一章绪论介绍了本文研究的课题意义,介绍了特征选择对模式识别的重要意义,从不同的实际问题上总结了特征选择的定义。最后对特征选择的历史与现状做了简要介绍,概括了目前特征选择算法的大致类型,分析比较了各自的优缺点。 

第二章介绍特征选择的整体框架,分析特征选择的各要素。特征选择的框架由“搜索策略”、“评价准则”、“停止条件”、“结果验证”四个方面组成。本文详细介绍了常用的“搜索策略”和“评价准则”。

第三章介绍Fisher准则和RelifF算法的评价准则,两者均是基于距离的标准,对特征进行排序,通过分类效果比较两者效果差异,选择效果好的作为后续内容的评价基准。对于Fisher准则可能出现的问题,提出了改进,并且比较与改进之前的差别。

第四章先是采取Fisher准则单维评价的方式选择前m个最优特征,进行分类,但是只能选择出于类别相关性较强的特征,无法保证特征之间的低冗余性,故又提出将Fisher准则和Mitra’s算法进行组合,构成双层结构,将前者剔除不相干特征的优势和后者剔除冗余特征的优势相结合,这样就可以删除不相干和冗余的特征;接着考虑特征之间的相互影响,将Fisher准则和增量搜索策略、减量搜索策略、浮动搜索策略向结合。增量搜索即顺序加入特征,评估特征子集;减量搜索即顺序剔除特征,评估特征子集;浮动则是加入、剔除交替进行尽量确保特征子集的全局最优性。用SVM分类器的分类正确率作为标准衡量特征子集的优劣。

第五章总结全文的研究,提出了进一步的问题,指导下一步的工作计划。

数据挖掘和机器学习迅速发展,应用领域也不断拓展,各应用领域的数据集正逐渐朝着大规模,高维度的方向发展,传统的数据挖掘收到了带来了前所未有的挑战,特征集中冗余特征和不相关特征的存在也加大了数据挖掘的难度,它不仅会消耗了更多的挖掘时间,而且会对算法准确率以及知识发现有着不利的影响。

目前的研究目的就是在于通过特征选择以来尽可能的避免一些存在的问题:“维数灾难”和“过拟合”,这样高维数据的学习训练就仍旧能使用传统的数据挖掘算法。因此,特征选择作为能够有效地“从高维数据中剔除不相关以及冗余特征”的预处理措施,有着重大的研究意义,面对目前海量数据,特征选择显得尤为重要,能在保证一定正确率的前提下,从原始特征空间中去除类别可分性较弱以及与别的特征冗余的特征,实现到降维的目的。

本文对于特征选择框架的两个重要步骤:搜索策略和子集评价准则进行了研究,确定了合适的评价准则的之后,与不同的特征子集生成方法进行了结合,并用实验数据比较了各自的优劣。

 

 


以上仅为该作品极少介绍,详细内容请点击购买完整版!

提示:此毕业设计论文完整版包含【论文
作品编号:txgc0965,word全文:53页,合计:21000

本通信工程毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——特征选择算法研究(论文)!
相关毕业设计
    没有关键字相关信息!