CART算法在客户分类中应用研究
[关键词:CART算法,客户分类] [热度 ]提示:此毕业设计论文完整版包含【论文】 作品编号:jskx0004,word全文:29页,合计:13000字 |
客户现状及问题描述
随着电子商务平台的快速发展,通过各种渠道的推广带来了大量的客户,由于不可控因素太大导致得到的客户存在大量的非目标客户。企业目前采用的方法是先通过关键字筛选,其次采用人工一条一条的人肉判断。企业投入了大量的人力、财力、物力在目标客户的筛选中,降低了企业生产效率。而数据挖掘技术可以快速地从海量客户中寻找到目标客户,不仅提高了企业的效率而且提升了查找目标客户的准确度。
研究目标
在各种推广渠道中,电子商务平台能够收集到客户的信息主要为静态信息,静态信息主要包括公司名称、公司地址、联系电话、传真、收集、email、网站等信息。由于收集的客户信息会存在一定的缺失和错误,因此在建模过程总必须寻找一种允许数据存在缺失和错误信息的模型。由于电子商务平台收集的客户信息量比较大,达到了上万,因此在建模过程中必须寻找一种可以快速分析海量数据的模型。同时考虑到企业的效益,这个模型的利润和价值必须由于原先的人工筛选方法。在达到上述三点目标的情况下,查找到一种最优的模型,能够利用最低成本的快速从海量客户中寻找目标客户的方法。
研究方法
主要采用分类树的理论对客户进行分类,根据训练集得到的规则,把客户分成目标客户和非目标客户,最终达成目的。
......
模型实现结构分析
本论文以浙江大区的电子商务平台中的客户为例,查看了大量数据挖掘技术,目标客户筛选扥方面的资料。通过客户的静态信息,采用回归分类树的算法,从海量的客户中快速地筛选出目标客户。最终达到提高企业效率的目的。同时运用CART算法对客户信息进行特征学习,得到判断客户是否为目标客户仅需公司名称、电话号码、联系人三个条件。将该算法运用到实际操作中,在信息管理部进行人工审核前一步实施,能够大量提高工作效率。
CART算法的不足
CART算法的不足主要体现在准确率没有别的分类例如逻辑回归方法高,但是本次模型的客户信息缺失率比较高,因此最终还是选择利用CART算法。且在实际运用中,用该方法先做粗糙的分类,再利用复杂的神经网络算法对客户信息进行评分。两者结合可以快速地提高工作效率。
进一步工作
从本次论文的模型中得到,对于电子商务平台的客户信息收集,最重要的有信息为公司名称的完整性,电话号码的正确性以及联系人的必要性。因此在实际情况中可以根据实际情况设置这三项为必填项。对于公司名称可以限制长度,提醒中文化等,对于电话号码限制长度,同时可以根据公司名称的填写,自动化搜索,提醒区号的正确化。对于联系人,可以设置为必填项且不允许例如XX先生,XX小姐类似的填写。提高填写的正确性。由于目前采用的数据为浙江大区的数据,故本模型比较适合于浙江大区而一旦把这个模型运用到全国,需要把这个判断规则加入分类树中,将会更加优化模型。
对于CART算法准确率稍低于其他方法的解决方法可以后续采用BOOSTING算法,对CART算法进行优化。
提示:此毕业设计论文完整版包含【论文】 作品编号:jskx0004,word全文:29页,合计:13000字 |
本信息与计算科学毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——CART算法在客户分类中应用研究(论文)!
-
没有关键字相关信息!