异质信息网络中的数据挖掘研究
[关键词:异质信息网络,数据挖掘] [热度 ]提示:此毕业设计论文完整版包含【论文,源程序,答辩稿】 作品编号:rjgc0380,word全文:40页,合计:19000字 |
影响力是存在于社交网络中微妙的支配力量,通过分析影响力,人人、Twitter 等社交网站便可以更好的提供好友推荐、内容推送等服务。而已有对影响力的研究大多是对是否存在影响力进行的定性分析,本文则对于异质信息网络中用户之间的影响力进行了定量分析。本文提出了一种概率生成模型,不但包括了异质链路信息,而且根据用户相关的文献信息来挖掘话题层面的影响力的大小。基于已知的直接的影响力,本文进一步研究了影响力传播和聚合机制:保守传播与非保守传播,从而得到间接影响力。
最后,本文通过对 Digg 社交网络中用户数据进行链路预测,验证了方法的有效性。实验结果显示,对用户行为预测的准确性较相似性研究有较大提高。
本文是基于前人研究[20]进行了扩展,并且也对某些部分进行了更为充分的讨论,本文主要研究内容包括:
将基于话题的影响力问题进行规范化,并且提出了一个概率生成模型,该模型既囊括了网络文献信息又将网络结构考虑在内,并且计算出了异质信息网络的直接影响力。
研究了影响力的两种传播方式——保守传播与非保守传播,并据此来计算间接影响力。
将求得的影响力应用于用户行为预测,来评估是否可以对某些社交应用起作用。
将实验应用于社交网络 Digg[31]、Twitter[32]、人人网[33]以及 CiteSeerX[34]中,定量定性的分析模型的可靠性。
本文章节安排
本文剩余章节安排如下:
第二章介绍异质信息网络,并对异质信息网络以及直接影响力、间接影响力的概念进行了阐述,介绍了影响力求解的基本的计算原理。
第三章首先给出了几个有利于建模的假设,目的是易于 PGM 方法的整体介绍。然后提出了 PGM 模型的核心算法,并对算法内容进行详细论述。最终结果是, 通过该建模得到每个用户的话题分布以及用户之间的直接影响力。
第四章定义了影响力两中基本的传播过程——原子传播与迭代传播,得到用户间接影响力。这一章安排的主要目的是方便理解影响力传播的两种方式。
第五章介绍影响力传播的两种机制:保守传播和非保守传播。作为模型的扩充,计算用户的间接影响力,以此使得用户行为预测更加准确。
第六章进行实验,对Digg 社交网络数据进行建模,获得用户影响力,以此来进行用户行为预测,并将两种传播方式进行分析和比较。
最后,对本文总结,并展望下一步的工作。
本文为大家提出了一个新颖的挖掘话题级别影响力的方法。本方法基本包括两个步骤,即 PGM 模型来挖掘节点之间的直接影响力以及应用不同类型的传播机制求解间接影响力以及整体影响力。在 PGM 模型中,本文将文本信息以及异质信息网络的链路信息相结合,形成一个统一的概率生成过程。影响力在整个网络中继续沿着链路进行传播。本文已经在不同的异质信息网络中进行各种扩展实验, 也发现了一些有趣的结论,最重要的一点是,使用影响力进行链路预测可以大大提高预测性能。
实际上,异质信息网络中影响力的分析为研究人员提供了......
提示:此毕业设计论文完整版包含【论文,源程序,答辩稿】 作品编号:rjgc0380,word全文:40页,合计:19000字 |
本软件工程毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——异质信息网络中的数据挖掘研究(论文,源程序,答辩稿)!