决策树的介绍

约定不等于承诺〃 2024-03-22 10:49 63阅读 0赞

一、介绍

决策树 (decision tree) 是一类常见的机器学习方法。它是一种树形结构，其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶节点代表一种分类结果。

例如，我们要对”这是好瓜吗?”这样的问题进行决策时，通常会进行一系列的判断或”子决策”我们先看”它是什么颜色?”，如果是”青绿色”，则我们再看”它的根蒂是什么形态?”，如果是”蜷缩”，我们再判断”它敲起来是什么声音?”，最后?我们得出最终决策:这是个好瓜.这个决策过程如图所示.

二、决策树的步骤

决策树有三个步骤：、决策树的生成、决策树的修剪。

决策树的算法是，根据许多个属性的值，得到一个明确的分类。也就是n个数据—>1个数据的过程。在一个数据有n个特征维度时，你会觉得很混乱不知道怎么做出判断，衡量这种混乱程度的就称为信息熵。决策的过程就是混乱度减轻，信息熵下降的过程。

（1）选择最优属性（根节点）

决策树判断一个属性是不是当前数据集的最优属性，是依靠信息熵变化的程度来选择的。选择某个属性，依照这个属性的值，对训练集进行划分，划分后的子训练集的信息熵之和，相比未分割前的数据集信息熵，下降最多的，就是当前的最优属性。也就是说，根据这个属性，我们就可以对数据集进行很大程度上的区分，例如猫和狗之间用耳朵区分，非常快。

（2）生成决策树。（叶子节点的选择）

选取最优属性后，根据此属性的取值，对原始数据集划分，得到子数据集，再将每个子数据集当作完整数据集，迭代进行最优属性的选取，直到数据集中样本都是同一个分类标签时，决策树生成过程结束。

有时根据场景业务需求的不同，也不要求数据集分割到无法再分类的程度，而是指定迭代的次数，即决策树到第几层就不再分割了，直接把当前叶子数据集中数量最多的分类标签作为叶子节点。这是不同的停止规则。

而决策树的三种常见算法，则是根据选择最优属性时计算的信息熵函数不同划分的。ID3 是根据信息熵，C4.5是根据信息增益率。CART是采用了基尼Gini系数。

（3）剪枝（防止过拟合）

剪枝是把通过训练集得到的决策树，切掉一些叶子节点，一方面可以减少判决步骤，提高判决效率。但更主要的是，防决策树模型对训练集数据过拟合。

三、代码实现

参考：

什么是决策树 | IBM

决策树(Decision Tree)：通俗易懂之介绍

发表评论取消回复

表情：

评论列表（有 0 条评论，63人围观）

还没有评论，来说两句吧...

相关阅读

相关决策树的介绍

一、介绍决策树 (decision tree) 是一类常见的机器学习方法。它是一种树形结构，其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每

约定不等于承诺〃/ 2024年03月22日 10:49/ 0 赞/ 64 阅读

相关决策树

决策树认识决策树决策树分类原理详解原理信息论基础信息適的定义决策树的划分依据之— —— 信息

爱被打了一巴掌/ 2022年12月29日 04:46/ 0 赞/ 96 阅读

相关决策树

[https://www.cnblogs.com/lovephysics/p/7231294.html][https_www.cnblogs.com_lovephysics_p

今天药忘吃喽~/ 2022年12月20日 02:22/ 0 赞/ 91 阅读

相关决策树介绍和使用

现在生活中，越来越多的时候需要进行判断和决策，因此关于怎么去判断和决策，需要根据一定的依据进行判断和决策，并不是凭空的按照自己的意愿去判断和决策，就比如举个例子；假如甲同

你的名字/ 2022年06月12日 01:47/ 0 赞/ 218 阅读

相关决策树

决策树是基于树结构来进行决策，这恰是人类在面临决策问题时一种很自然的处理机制。例如，我们要对“这是好瓜吗？”这样的问题进行决策时，通常会进行一系列的判断或“子决策”：我们先看“

旧城等待，/ 2022年05月25日 05:39/ 0 赞/ 433 阅读

相关决策树

一、决策树简介决策树是一种特殊的树形结构，一般由节点和有向边组成。其中，节点表示特征、属性或者一个类。而有向边包含有判断条件。如图所示，决策树从根节点开始延伸，经过不

骑猪看日落/ 2022年05月17日 00:55/ 0 赞/ 396 阅读

相关决策树

1 认识决策树如何高效的进行决策？特征的先后顺序（哪个特征先看，哪个特征后看） 2 决策树分类原理详解（看哪个特征能筛掉更多的数据，尽可能通过少

小咪咪/ 2022年04月23日 01:16/ 0 赞/ 313 阅读

相关决策树

决策树声明本文是来自网络文档和书本(周老师)的结合。概述决策树(Decision Tree）是在已知各种情况发生概率的[基础][Link 1]上，通

青旅半醒/ 2022年01月30日 06:49/ 0 赞/ 571 阅读

相关决策树

决策树对实例进行分类的树形结构，由节点和有向边组成。其实很像平时画的流程图。学习决策树之前要搞懂几个概念：熵：表示随机变量不确定性的度量，定义：H（p）=-![1409

冷不防/ 2021年09月30日 04:16/ 0 赞/ 590 阅读

相关决策树

熵的定义 ![5057999-5702853710d12e87.png][] 计算给定数据集的熵 def calcShannonEnt(dataSet):

客官°小女子只卖身不卖艺/ 2021年09月15日 06:34/ 0 赞/ 557 阅读