收藏本站 | 论文目录

关键词: python matlab plc 单片机 dsp fpga 仿真 stm32

短评主题聚类及效果测评

[关键词:短评,主题聚类,效果测评]  [热度 ]
提示:此毕业设计论文完整版包含【论文
作品编号:xxgl0009,word全文:30页,合计:18000

以下仅为该作品极少介绍,详细内容请点击购买完整版!
短评主题聚类及效果测评毕业设计论文------

基于以上特点,本文以豆瓣读书图书短评作为研究对象,分别采用机器聚类及人工审读两种方法对同一文本集进行聚类。机器聚类算法通过LDA模型对短文本集进行建模之后采用KL距离计算文本间的相似度最终使用基于sing-pass思想的增量聚类算法对文本集进行聚类,聚类完成后提取相应簇类的特征词对聚类结果进行描述;而人工审读聚类则完全由审读人员通过对短评内容的语义理解进行聚类,并自主选择簇类特征词进行描述。聚类完成后设计聚类有效性实验以对比两种聚类方式得到结果的相似度及验证聚类结果对相应图书主题的表现效果。

豆瓣读书短评是由用户阅读完某本图书后自主编辑生成的,可以较好的反映读者对于图书内容的理解与感受。本文选择了豆瓣读书年度高分图书榜单排名靠前的十本书的短评内容作为研究对象,分别采用机器聚类及人工审读两种方法对文本进行聚类,并提取相应簇类的特征词对聚类结果进行描述,之后使用一定的评分方式对比两种聚类方法得到结果的相似度,从而探讨机器聚类算法在实际应用中的效果并对网站信息组织及利用提出相关建议;同时,通过实验验证聚类结果对相应图书主题的反映效果,探究读者理解与作者原意间的吻合度,期望以此推广至验证用户评价对于产品原始设计目标的反映能力。

本文的内容安排如下:

第二章主要介绍短文本特点、短文本聚类过程中存在的问题及现有研究中典型的短文本聚类思想,同时介绍了本文进行机器聚类过程中使用的具体算法及技术。

第三章主要介绍通过机器聚类及人工审读两种方法对文本进行聚类的具体过程。

第四章针对两种聚类方式得到的结果设计了两个实验,第一个实验用于对比两种聚类算法结果的相似度;第二个实验用于探究读者理解与作者原意间的吻合度。具体介绍了实验的目的及操作过程,最后对实验结果进行了详细分析。

结论部分给出了本文所做的工作以及创新点,并指出了工作中的不足和相关研究前景。

 

 


以上仅为该作品极少介绍,详细内容请点击购买完整版!

提示:此毕业设计论文完整版包含【论文
作品编号:xxgl0009,word全文:30页,合计:18000

本信息管理与系统毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——短评主题聚类及效果测评(论文)!
相关毕业设计
    没有关键字相关信息!