摘要: 针对决策树分类方法的计算效率进行深入研究,根据信息增益计算的特点,引入了上凸函数的概念,用于提高决策树分类过程中信息增益的计算效率。利用我们所提出的“一致性定理”和“特殊一致性定理”,从理论上证明了利用上凸函数对信息增益计算进行改进后,构造的决策树与原决策树具有相同的分类准确率。同时我们通过对大数据集的实验,发现在相同规模的数据集下,改进后的决策树算法比原算法有更高的计算效率,并且这种计算效率的提高有随着数据集规模的增加而增加的趋势。
中图分类号:
高学东, 尹阿东, 张健, 宫雨, 武森. 利用上凸函数对决策树算法的改进[J]. 中国管理科学, 2004, (4): 144-148.
GAO Xue-dong, YIN A-dong, ZHANG Jian, GONG Yu, WU Sen. An Improved Algorithm of Decision Trees by Using the Convex Function[J]. Chinese Journal of Management Science, 2004, (4): 144-148.