中国管理科学 ›› 2010, Vol. 18 ›› Issue (3): 58-67.
罗彬1, 邵培基1, 罗尽尧1, 刘独玉2, 夏国恩3
LUO Bin1, SHAO Pei-ji1, LUO Jin-yao1, LIU Du-yu2, XIA Guo-en3
摘要: 针对电信客户流失预测问题的复杂性,融合自组织神经网络良好的连续属性值离散化优势、粗糙集理论出色的属性约简功能和蚁群优化算法全局的随机搜索特点,在模型集成技术和成本敏感学习理论的基础上,提出了一种新的基于蚁群算法的成本敏感线性集成多分类器的电信客户流失预测模型。构建该集成模型可分为4个阶段:(1)连续属性值的离散处理:利用自组织神经网络对连续属性值进行非监督离散化处理;(2)原始属性集的约简处理:使用粗糙集理论按属性重要性原则对离散属性进行约简;(3)子分类器的建立:分别使用NaiveBayes、Logistic回归、多层感知器和决策树等4种差异性很大的分类技术在约简属性集上建立4个对应的客户流失预测子分类器;(4)子分类器的集成:基于成本敏感学习理论,构建了4种不同的线性集成模型,采用蚁群优化算法求解集成模型的最优线性组合权重系数。将该模型应用于某电信客户流失预测,其实验结果表明该集成方法是可行且有效的。
中图分类号: