首页 > 文章 > python教程

Python模型参数查看，model.summary详解

时间：2026-04-13 14:23:35 190浏览收藏

本文深入解析了在深度学习实践中频繁遇到的 `model.summary()` 使用陷阱与替代方案，揭示其仅适用于已构建且符合Keras规范的模型，而对PyTorch、Hugging Face或自定义类模型直接调用会引发AttributeError；针对卡顿、无输出、形状推断失败等问题，给出了强制build、喂入dummy输入等实操解法；同时指出默认输出的局限性，推荐`expand_nested`、`count_params()`、逐层查权重及变量遍历等精准诊断手段，并澄清了summary不反映GPU设备分配的设计本质——帮助开发者跳出“万能方法”误区，根据框架特性智能选用真正有效的模型结构探查工具。

Python环境下如何查看模型参数_调用model.summary方法输出结构详情

model.summary() 报 AttributeError：'Model' object has no attribute 'summary'

这是最常见的一击即溃——你以为模型有 summary()，其实它根本不是 Keras 的 tf.keras.Model 或 keras.Model 实例。比如你用 PyTorch 加载了模型，或者用 tf.keras.Sequential 以外的方式构建（如纯函数式 API 但没显式封装），又或者用的是 Hugging Face 的 PreTrainedModel，它们全都没有 summary() 方法。

实操建议：

先确认类型：type(model) —— 输出是或才能放心调用
PyTorch 模型用 print(model) 或 torchinfo.summary(model, input_size=...) 替代
Hugging Face 模型看 model.config，或用 model.num_parameters() + 手动遍历 model.named_parameters()
自定义类没继承 tf.keras.Model？那就别硬调 summary()，改用 model.layers 循环打印

调用 model.summary() 时卡住、无输出或报 ValueError：Input 0 is incompatible with layer

本质是模型还没“见过输入形状”，Keras 需要推断每层的 output shape 才能打印结构。如果模型是函数式构建、或含动态 shape（如带 None 的 batch 维），而你又没预先 call 过一次，summary() 就会懵。

实操建议：

在调用前强制 build：model.build(input_shape=(None, 224, 224, 3))（注意 batch 维用 None）
更稳妥的做法是先喂一个 dummy 输入：model(tf.random.normal((1, 224, 224, 3)))，再调 summary()
避免用 model.summary(print_fn=lambda x: print(x)) 调试——它不解决 shape 推断问题，只改输出方式
若模型含自定义层且没实现 compute_output_shape，summary 可能失败；此时优先检查该层的 call() 是否依赖未声明的 shape 逻辑

summary() 输出太简略，看不到参数量或某层具体权重形状

默认 model.summary() 只显示每层名称、output shape 和参数数量（Total params），但不会展开 Conv2D 的 kernel size、BatchNorm 的 gamma/beta 是否可训练，也不会告诉你 Embedding 层的 vocab size × embedding_dim 是怎么算出来的。

实操建议：

加参数 expand_nested=True（适用于含子模型的结构，如 tf.keras.Sequential 嵌套在函数式模型里）
用 model.count_params() 单独获取总参数量，比 summary 里的数字更可靠（避免 summary 因未 build 导致计数为 0）
想看某一层的权重细节？直接查：model.layers[2].get_weights()[0].shape（假设第 3 层是 Dense），或 model.layers[2].trainable_weights
需要完整参数清单？循环 model.variables，过滤 trainable=True，再打印 .name 和 .shape

TensorFlow 2.x + eager mode 下 summary() 不显示 GPU 设备信息

这不是 bug，是设计如此。summary() 只负责结构和参数，不反映运行时设备分配。即使模型已 .cuda() 或 tf.device('/GPU:0')，summary 输出也看不出哪层在 GPU 上。

实操建议：

验证设备绑定：用 model.variables[0].device 查第一个变量所在设备
想确认是否真在 GPU 运行？加一行 print([v.device for v in model.variables[:3]])
summary 输出里 “None” 在 shape 中不代表设备未指定，而是 batch 维动态；别把它和设备混为一谈
真要可视化设备布局？得用 tf.summary.trace_export + TensorBoard，不是 summary() 的活

实际调试时，最容易被忽略的是：**model.summary() 不是万能结构探测器，它只对已 build 且符合 Keras 约定的模型有效。一旦涉及混合框架、动态图或自定义构建流程，就得切换工具链，而不是反复重试 summary()。**

今天带大家了解了的相关知识，希望对你有所帮助；关于文章的技术知识我们会一点点深入介绍，欢迎大家关注golang学习网公众号，一起学习编程~

资料下载

编程学习资料下载

精选编程（Golang、Python、Java、C++、JavaScript等）教程、电子书与示例源码，一键打包本地下载学习。

立即下载