收藏本站 | 论文目录

关键词: python matlab plc 单片机 dsp fpga 仿真 stm32

大数据系统下数值预测以及案例分析

[关键词:大数据系统,数值预测,案例分析]  [热度 ]
提示:此毕业设计论文完整版包含【论文
作品编号:jskx0271,word全文:28页,合计:8500

以下仅为该作品极少介绍,详细内容请点击购买完整版!
大数据系统下数值预测以及案例分析毕业设计论文------

本课题主要是大数据下的数据分类分析和对数据挖掘的算法研究及其应用。在大数据集群系统中使用支持向量机的算法来分析计算学生上网时长和绩点的相关性,由此根据学生上网时长推测其成绩分布。通过数据挖掘算法实例化的研究,为学校管理提供了客观性的参考。

大数据时代,如何从大量杂乱的数据中提取出有价值的信息是各行各业面临的挑战。本课题主要是数据挖掘中支持向量机算法的研究,通过分析本校学生每天的上网时长和学生平均绩点的数据相关性,建立模型,并由上网时长预测其成绩分布。运用现有的分析工具如:Excel、R、MATLAB和统计学上的分析方法(对比分析、相关分析)去寻找到数据的特征,选取合适的样本。基于支持向量机算法的理论支持,用MATLAB去训练一部分已选取出来样本,训练出描述数据的模型。再用剩下的已选取样本数据去测试刚刚得到的模型(已知道测试数据集的标签),得到一个准确率,准确率意味着模型的可信赖程度。在准确率高的情况下,最后用一组未知成绩分布的上网时长数据去预测其分布,最终得到分类号。通过上网时长数据案例的分析去了解大数据系统下数据挖掘中支持向量机算法的实用性,进而为学校的学生管理工作安排或管理措施实行提高客观性的参考资料。

建模过程

数学建模通常是将现实中复杂的问题之间的关系用数学算法或式子描述出来。本课题是

(1)首先对已知的问题进行必要的分析观察,提出合理的假设,使问题的主要特征体现出来,忽略次要问题。采集的数据有限,对于每个月每天的上网时长研究,并没有与学生成绩绩点有明显的相关性,但长期作用下来肯定存在关联性,所以研究每月上网的总时长与成绩绩点之间的关系。

(2)根据所做的假设以及事物之间的关系,构造各种变量之间的关系 ;根据数据特征的分析,上网时长和学生成绩绩点存在一定程度上的相关性。

(3)对构造出来的关系进行简化,采用合适的数学式子或者数学模型将此类关系表达出来;即对学生每月上网的总时长和绩点之间关系进行分类,找出能代表各类别的支持点;

(4)用实际情况对简化后的式子进行验证,修改、完善此数学模型;用一部分学生每月上网总时长和成绩绩点去测试检验上面各类别的是支持点的正确性。

(5)将验证后的数学模型投入运用。即可以通过学生每月上网总时长去推测其成绩的分布情况。

 

 


以上仅为该作品极少介绍,详细内容请点击购买完整版!

提示:此毕业设计论文完整版包含【论文
作品编号:jskx0271,word全文:28页,合计:8500

本信息与计算科学毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——大数据系统下数值预测以及案例分析(论文)!