首页 > 文章 > python教程

Python决策树绘制：分类与回归树训练及Graphviz可视化

时间：2026-04-06 11:06:34 484浏览收藏

本文深入解析了Python中决策树的两种主流可视化方法：轻量级的sklearn.tree.plot_tree（无需额外依赖，直接集成matplotlib，适合快速调试结构、分裂逻辑与样本分布）和专业级的export_graphviz+Graphviz工具链（支持导出高清矢量图，但需妥善配置系统级Graphviz环境），并重点厘清了分类树与回归树在value含义、参数适配（如class_names仅对分类有效）、着色逻辑及常见陷阱（如未训练模型、PATH缺失、precision设置不当导致渲染失败）等方面的本质差异，帮助读者避开实操中的高频坑点，真正看懂、画好、用对决策树可视化。

Python决策树怎么画_分类树与回归树模型训练及Graphviz结构可视化

怎么用 `plot_tree` 快速画出决策树结构图

不用 Graphviz 也能看树，sklearn.tree.plot_tree 是最轻量的方案。它直接在 matplotlib 里渲染，适合快速检查分裂逻辑、深度、样本数分布。

常见错误是传入未训练的模型——plot_tree 要求模型已调用 fit()；另外默认不显示特征名和类别名，图看起来像天书。

必须传入已训练的 DecisionTreeClassifier 或 DecisionTreeRegressor
加 feature_names=feature_names 和 class_names=class_names（分类树才需要）才能看懂节点含义
小树用 max_depth=3 控制显示层级，否则深层树会挤成一团
回归树的 class_names 参数无效，别传；它的叶节点显示的是预测值（value）而非类别

from sklearn.tree import plot_tree
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
plot_tree(clf, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, rounded=True, fontsize=10)
plt.show()

Graphviz 导出 PDF/SVG 需要绕过哪些环境坑

想导出高清矢量图（比如插论文），就得走 export_graphviz + graphviz 工具链。真正卡住人的从来不是 Python 代码，而是系统级依赖。

典型现象：跑 dot -V 报错 command not found，或 Python 里提示 ExecutableNotFound: failed to execute ['dot']。

Mac 用户装了 graphviz Python 包，但没装系统级 graphviz 二进制（brew install graphviz 缺一不可）
Windows 用户装完 Graphviz 安装包后，必须手动把 dot.exe 所在路径（如 C:\Program Files\Graphviz2.44\bin）加进系统 PATH
Conda 环境下慎用 conda install python-graphviz，它不装 dot，推荐 conda install -c conda-forge python-graphviz graphviz
export_graphviz 输出的是 DOT 文本，得用 Source（来自 graphviz 包）封装后才能 render，不能直接写文件再双击打开

分类树和回归树在可视化时的关键差异

同一个 plot_tree 函数，画分类树和回归树时表现不同，不是 bug，是设计使然。忽略这点会导致误读叶节点数值。

比如你看到一个叶节点标着 value = [12.3]，这在分类树里毫无意义（该是数组计数），但在回归树里就是预测值。

分类树的 value 是各类别样本数量数组，如 [5, 0, 17] 表示该叶有 5 个 class 0、0 个 class 1、17 个 class 2
回归树的 value 是标量数组，如 [14.2]，即该叶所有样本目标值的均值（也是预测输出）
filled=True 下，分类树按类别分布上色，回归树按预测值大小上色（颜色深浅对应数值高低）
回归树不支持 class_names，传了会静默忽略；分类树若没传 class_names，只显示数字索引