基于通信公司消费数据的客户离网分析
[关键词:通信公司,消费数据,客户离网] [热度 ]提示:此毕业设计论文完整版包含【论文】 作品编号:xxgl0123,word全文:56页,合计:27000字 |
第一步,根据本课题所需要考虑的客户离网因素,在某公司所提供的数据字典中,找出与这些因素密切相关的字段,然后从原始数据库中重新创建所需的表格,以提高数据挖掘的效率。
第二步,对数据进行预处理。原始数据中难免会出现数据的不完整性,我们需要做的是如何处理这些不完全的数据,以及有很多数据不能直接从数据表中得到,需要我们进行一定的处理,如用户在网时长等的获得就需要进行一定的计算。
第三步,基于前两步的工作,逐个分析对用户离网有着重要影响的用户属性。本步骤的主要工作集中体现在针对所需考虑的用户属性,新建数据库表格,然后利用crystal reports进行作图,直观得到用户属性对用户离网率的影响。
第四步,整理以上的材料,撰写毕业论文。
本章我们从可能影响用户离网的因素出发,利用数据来验证这些可疑因素中哪些是真正影响用户离网的主要因素以确定影响用户离网的属性集合以及离网用户的特征。我们采用图表与数据结合的方法,共讨论8个可疑因素:第一、区县与用户离网率的关系。第二、年龄与离网率的关系。第三、月平均消费额与离网率的关系。第四、月平均通话次数与用户离网的关系。第五、月平均通话时长与离网率的关系。第六、品牌与用户离网的关系。第七、在网时长与离网率的关系。第八、性别与用户离网率的关系。最后确定了影响用户离网的7个重要用户属性:区县、年龄、月平均消费额、月平均通话次数、月平均通话时长、品牌、在网时长,以及针对这7个用户属性的最有可能离网的用户的特征。
本课题所做的工作
本课题所做的主要工作是从某通信公司提供的大量的、不完全的、含噪声数据的原始数据中挖掘出和用户离网密切相关的因素,进而为后面进行离网函数的构筑打下一个坚实的基础,以便为某通信公司的决策提供一定的依据。
由于某通信公司提供的原始数据呈现出数据量庞大、数据不完全性等特点,所以本课题的第一步工作就是在明确课题目标的前提下,进行对数据的预处理,将与本课题的研究无关的数据忽略,将与本课题密切相关的数据中出现的错误与缺失利用恰当的数据预处理方法进行处理。使得经过处理的数据具有完全性并且规模相对较小,便于进行后面的分析处理。这个过程主要步骤有:第一,在明确课题目标的前提下,依据某通信公司提供的数据字典,找出与本课题研究密切相关的数据表与字段;第二,针对上一步得到的数据表与字段,结合这些数据的特点,进行相应的数据清理,在本课题中,主要是对错误数据和缺失数据的处理,处理方法我们均采取忽略。第三,间接数据的获得。本课题需要讨论的很多用户属性都不能直接从数据表中获得,这就需要我们采取一定的方法获得这些间接数据,如我们在只知道身份证信息的前提下如何得到......
提示:此毕业设计论文完整版包含【论文】 作品编号:xxgl0123,word全文:56页,合计:27000字 |
本信息管理与系统毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——基于通信公司消费数据的客户离网分析(论文)!