决策树

小咪咪 2022-04-23 01:16 312阅读 0赞

1 认识决策树
如何高效的进行决策?
特征的先后顺序(哪个特征先看,哪个特征后看)
2 决策树分类原理详解(看哪个特征能筛掉更多的数据,尽可能通过少的决策,达到目的)
已知 四个特征值 预测 是否贷款给某个人
先看房子,再工作 -> 是否贷款 只看了两个特征
年龄,信贷情况,工作 看了三个特征
信息论基础
1)信息
香农:消除随机不定性的东西
小明 年龄 “我今年18岁” - 信息
小华 ”小明明年19岁” - 不是信息
2)信息的衡量 - 信息量 - 信息熵
单位:bit
计算公式:g(D,A) = H(D) - 条件熵H(D|A)
4 决策树的划分依据之一———信息增益
3 决策树可视化
4 决策树总结
优点:可视化 - 可解释能力强
缺点:容易产生过拟合
5 案例:泰坦尼克号乘客生存预测
流程分析:
特征值 目标值
1)获取数据
2)数据处理
缺失值处理
特征值 -> 字典类型
3)准备好特征值 目标值
4)划分数据集
5)特征工程:字典特征抽取
6)决策树预估器流程
7)模型评估

#

代码:

  1. from sklearn.datasets import load_iris
  2. from sklearn.model_selection import train_test_split
  3. from sklearn.tree import DecisionTreeClassifier, export_graphviz
  4. def decision_iris():
  5. """
  6. 用决策树对鸢尾花进行分类
  7. :return:
  8. """
  9. # 1)获取数据集
  10. iris = load_iris()
  11. # 2)划分数据集
  12. x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=22)
  13. # 3)决策树预估器
  14. estimator = DecisionTreeClassifier(criterion="entropy")
  15. estimator.fit(x_train, y_train)
  16. # 4)模型评估
  17. # 方法1:直接比对真实值和预测值
  18. y_predict = estimator.predict(x_test)
  19. print("y_predict:\n", y_predict)
  20. print("直接比对真实值和预测值:\n", y_test == y_predict)
  21. # 方法2:计算准确率
  22. score = estimator.score(x_test, y_test)
  23. print("准确率为:\n", score)
  24. # 可视化决策树
  25. export_graphviz(estimator, out_file="iris_tree.dot", feature_names=iris.feature_names)
  26. return None
  27. if __name__ == "__main__":
  28. decision_iris()

发表评论

表情:
评论列表 (有 0 条评论,312人围观)

还没有评论,来说两句吧...

相关阅读

    相关 决策

    1 决策树学习是以实例为基础的归纳学习算法,是应用最广泛的逻辑方法。 2 典型的决策树学习系统采用自顶向下的方法,在部分搜索空间中搜索解决方案。它可以确保求出一个简单的决策树

    相关 决策

    决策树是基于树结构来进行决策,这恰是人类在面临决策问题时一种很自然的处理机制。例如,我们要对“这是好瓜吗?”这样的问题进行决策时,通常会进行一系列的判断或“子决策”:我们先看“

    相关 决策

    一、 决策树简介 决策树是一种特殊的树形结构,一般由节点和有向边组成。其中,节点表示特征、属性或者一个类。而有向边包含有判断条件。如图所示,决策树从根节点开始延伸,经过不

    相关 决策

    决策树:决策树是一个树形结构,每个非叶节点表示一个特征树形的测试,每个分支代表这个特征属性在某个值域上的输出,而叶节点存放一个类别。 使用决策树进行决策的原理就是: 从根

    相关 决策

    1 认识决策树     如何高效的进行决策?     特征的先后顺序(哪个特征先看,哪个特征后看) 2 决策树分类原理详解(看哪个特征能筛掉更多的数据,尽可能通过少

    相关 决策

    决策树 声明 本文是来自网络文档和书本(周老师)的结合。 概述 决策树(Decision Tree)是在已知各种情况发生概率的[基础][Link 1]上,通

    相关 决策

    决策树对实例进行分类的树形结构,由节点和有向边组成。其实很像平时画的流程图。 学习决策树之前要搞懂几个概念: 熵:表示随机变量不确定性的度量,定义:H(p)=-![1409