首页 > 文章 > python教程

Scikit-learn绘制ROC曲线教程

时间：2026-05-20 11:31:45 234浏览收藏

本文深入解析了使用Scikit-learn绘制ROC曲线时最常见、最易踩坑的四大核心问题：如何确保输入格式正确（必须是正类概率或决策函数值，而非原始预测标签）、如何在同一图表中清晰叠加多个模型的ROC曲线（关键在于复用ax参数并统一测试集）、为何AUC数值与曲线视觉感受不一致（需区分AP与AUC、正确处理多分类及避免误用predict）、以及如何导出无截断的高清图像（tight_layout()调用时机和bbox_inches='tight'缺一不可），每一步都配有可直接复用的代码示例和底层原理说明，助你从“画不出”“对不上”“叠不了”“存不好”的困扰中彻底解脱。

Python中如何绘制Scikit-learn的ROC曲线_使用RocCurveDisplay

ROC曲线画不出来？先确认`RocCurveDisplay`的输入格式是否正确

Scikit-learn 1.0+ 版本中，RocCurveDisplay 不接受原始预测标签（如 y_pred），只接受**预测概率的正类得分**（即 classifier.predict_proba(X)[:, 1] 或 classifier.decision_function(X)）。传入 y_pred 会导致曲线异常平直或报错 ValueError: y_true and y_score must have the same shape。

实操建议：

对二分类器，优先用 predict_proba：确保模型支持该方法（如 LogisticRegression、RandomForestClassifier 支持；SVC 默认不支持，需设 probability=True）
若模型无 predict_proba（如默认 SVC），改用 decision_function —— 它输出的是“距离超平面”的带符号值，也可作为排序依据
检查 y_true 是否为一维数组且 dtype 是 int 或 bool；含多于两类的 y_true 会触发 ValueError: Only one class present in y_true

如何在同一个图里画多个模型的ROC曲线

RocCurveDisplay 本身不支持直接叠加，但可以复用其 .plot() 的 ax 参数实现多模型绘制。关键点是：第一个模型调用 .plot() 返回 matplotlib.axes.Axes 对象，后续模型传入同一 ax，并手动设置 label。

示例片段：

from sklearn.metrics import RocCurveDisplay
import matplotlib.pyplot as plt
fig, ax = plt.subplots()
RocCurveDisplay.from_estimator(clf1, X_test, y_test, ax=ax, name="Logistic")
RocCurveDisplay.from_estimator(clf2, X_test, y_test, ax=ax, name="Random Forest")
ax.plot([0, 1], [0, 1], "k:", label="Random classifier")  # 对角线
ax.legend()

注意：

所有模型必须用同一组 X_test 和 y_test，否则横纵坐标尺度不一致
from_estimator 内部会自动调用 predict_proba 或 decision_function，无需预先计算；但若想复用预测结果（比如节省时间），可用 from_predictions(y_true, y_score)
不同模型输出的分数量纲可能差异大（如概率 vs 决策值），但 ROC 只依赖排序，不影响曲线形状

为什么AUC值和ROC曲线看起来“对不上”？关注`average_precision`和`roc_auc_score`的区别

RocCurveDisplay 显示的 AUC 值来自 sklearn.metrics.roc_auc_score，它默认按“宏平均”处理多标签，而你在别处看到的 average_precision（如 PR 曲线）是另一套指标。混淆二者会导致误判模型性能。

常见误区：

把 precision_recall_curve 的 AP 值当成 ROC 的 AUC —— 两者数值不可比，PR 曲线对类别不平衡更敏感
多分类场景下未指定 multi_class 参数：roc_auc_score(y_true, y_score, multi_class="ovr") 才对应 RocCurveDisplay 的默认行为（One-vs-Rest）
使用 predict 而非 predict_proba 计算 AUC → 得到的是单阈值下的准确率，不是积分意义上的 AUC

保存高分辨率ROC图时字体和图例被截断？调整`plt.tight_layout()`时机

直接在 RocCurveDisplay.from_estimator(...).plot() 后调用 plt.tight_layout() 常常无效，因为 .plot() 内部已触发绘图，但图例等元素尚未完全布局。

可靠做法：

用 ax.figure 获取画布对象，在所有 .plot() 调用完毕、ax.legend() 之后，再执行 ax.figure.tight_layout()
导出时指定 bbox_inches='tight'：如 plt.savefig("roc.png", dpi=300, bbox_inches='tight')
若图例仍重叠，改用 ax.legend(loc='lower right') 或 ax.legend(bbox_to_anchor=(1.05, 1)) 避免覆盖曲线

真正容易被忽略的是：当用 from_predictions 手动传入 y_score 时，如果 y_score 是二维（如 OneVsRest 输出），RocCurveDisplay 会尝试自动展平，但可能出错 —— 此时应显式取正类列，例如 y_score[:, 1] 或 y_score[1]（取决于格式）。

今天带大家了解了的相关知识，希望对你有所帮助；关于文章的技术知识我们会一点点深入介绍，欢迎大家关注golang学习网公众号，一起学习编程~

Scikit-learn绘制ROC曲线教程

ROC曲线画不出来？先确认RocCurveDisplay的输入格式是否正确

如何在同一个图里画多个模型的ROC曲线

为什么AUC值和ROC曲线看起来“对不上”？关注average_precision和roc_auc_score的区别

保存高分辨率ROC图时字体和图例被截断？调整plt.tight_layout()时机

ROC曲线画不出来？先确认`RocCurveDisplay`的输入格式是否正确

为什么AUC值和ROC曲线看起来“对不上”？关注`average_precision`和`roc_auc_score`的区别

保存高分辨率ROC图时字体和图例被截断？调整`plt.tight_layout()`时机