某省制造业注销企业特征分析
[关键词:制造业,注销企业] [热度 ]提示:此毕业设计论文完整版包含【论文】 作品编号:jskx0197,word全文:53页,合计:18000字 |
论文主要工作总结
本论文以某省工商行政管理局汇总库中的企业数据为背景,应用数据挖掘技术建立省制造业注销企业特征模型,采用C5.0和C&R Tree两种算法检验数据,分析结果,选择评估效果较好的C5.0模型。
主要解决的问题是:从省工商行政管理局的数据仓库中取出注销企业、在册企业的相关数据(企业类型、行业、登记机关、企业规模等),对这些数据进行选择、清洗和预处理,建立注销企业与在册企业的对比模型,从而找出制造业企业被注销的影响因子,给出合理特征分析。
通过最后选择的C5.0算法建模,可知省制造业注销企业的影响因子为:经营年限、产值规模、实际出资额、城乡标志、企业规模、法定代表人文化程度、法定代表人政治面貌、法人代表年龄、登记机关。
模型的改进
省工商行政管理局数据仓库中的数据由于一些客观因素的存在,使得很多字段录入不准确或者缺失。
从业务角度分析,企业被注销可能还受从业人数、投资总额、产值、税后利润、亏损等字段影响。当数据不完整时,一般情况下可以进行缺失值处理。
对于缺失值的处理,从总体上来说分为删除存在缺失值的个案和缺失值插补。对于主观数据,仍将影响数据的真实性,存在缺失值的样本的其他属性的真实值不能保证,那么依赖于这些属性值的插补也是不可靠的,所以对于主观数据一般不推荐插补的方法。插补主要是针对客观数据,它的可靠性有保证。由于从业人数、投资总额、产值、税后利润、亏损等字段的数据是以整型或浮点型存在的,存在的很强的不确定性,因此不能随便填补。
如果以后条件允许,可以加入上述字段通过建模进行进一步分析。
提示:此毕业设计论文完整版包含【论文】 作品编号:jskx0197,word全文:53页,合计:18000字 |
本信息与计算科学毕业设计论文作品由 毕业论文设计参考 [http://www.qflunwen.com] 征集整理——某省制造业注销企业特征分析(论文)!