首页 > 文章 > python教程

Foolbox库：Python对抗样本生成教程

时间：2026-03-15 15:30:45 353浏览收藏

本文深入解析了使用Foolbox库生成对抗样本时四大高频痛点：PyTorch模型因返回softmax输出或处于eval模式导致的NotImplementedError、PGD攻击不收敛源于stepsize与steps超参失配、TensorFlow模型因eager execution未启用引发的numpy转换错误，以及对抗样本保存后图像发灰的本质原因——归一化范围（bounds）与数据类型处理错位；文章不仅直击根源，更提供可立即落地的实操方案，涵盖模型模式设置、logits输出规范、超参调优策略、eager模式启用技巧及图像数值范围精准对齐方法，助你绕过玄学报错，稳定生成高质量对抗样本。

Python 对抗样本生成的 Foolbox 库

为什么 `foolbox` 的攻击在 PyTorch 模型上总报 `NotImplementedError: Cannot differentiate through this function`

因为默认的 foolbox 攻击器（尤其是 v3.x）要求模型返回原始 logits，且必须支持梯度回传；而很多 PyTorch 模型封装后自动调用了 torch.nn.functional.softmax 或 model.eval() 下禁用了梯度，导致攻击中途断掉。

实操建议：

确保模型处于训练模式：model.train()，哪怕只是做推理——foolbox 需要中间层梯度
模型输出必须是未归一化的 logits，不能是 softmax 或 log_softmax 结果；检查 forward 最后一行是不是直接 return logits
用 foolbox.PyTorchModel 包装时，显式传参 bounds=(0, 1) 或对应图像范围，并设 device 与模型一致
若模型有 Dropout 或 BatchNorm，攻击时可能行为不稳定，临时替换为 nn.Identity 更可靠

`foolbox` 的 `PGD` 攻击不收敛、扰动看起来像噪声

这不是模型问题，大概率是步长（stepsize）和迭代次数（steps）没调对。PGD 对超参敏感，尤其在 eps 较小时，过大的 stepsize 会让优化跳过局部极值，结果就是扰动发散、分类置信度乱跳。

实操建议：

stepsize 一般取 eps / 4 到 eps / 2，比如 eps=0.03 时用 stepsize=0.007
steps 至少 10～40；低于 10 很难找到强对抗样本，高于 100 可能过拟合到当前 batch
务必开启 random_start=True（默认是 False），否则从干净样本起点容易陷入弱扰动陷阱
如果攻击目标类别固定（targeted=True），注意目标 label 必须是模型能输出的合法 class index，别越界

用 `foolbox` 测 TensorFlow/Keras 模型时提示 `AttributeError: 'Tensor' object has no attribute 'numpy'`

这是 eager execution 关闭或张量未同步导致的。Foolbox v3+ 内部会尝试把中间结果转成 NumPy 做约束投影（比如 clip 到 [0,1]），但 TF 默认图模式下 Tensor 不支持直接 .numpy()。

实操建议：

启动脚本开头加 import tensorflow as tf; tf.config.run_functions_eagerly(True)
用 foolbox.TensorFlowModel 包装时，forward 函数返回值必须是 EagerTensor，不能是 SymbolicTensor（即别用 tf.keras.Model 的函数式 API 构建后直接传入）
更稳妥的做法：先把 Keras 模型导出为 SavedModel，再用 tf.keras.models.load_model 加载并确保 training=False 被忽略（因为 Foolbox 需要梯度）
如果只做评估不攻击，可改用 foolbox.attacks.L2BasicIterativeAttack 这类轻量攻击，对 eager 依赖略低

生成的对抗样本保存后图像发灰、对比度崩坏

本质是数据类型溢出或归一化错位。Foolbox 内部按 float32 在 [0,1] 或 [−1,1] 处理图像，但 OpenCV/PIL 保存时默认期待 uint8 的 [0,255]，中间少一次缩放就会全图变暗或死白。

实操建议：

保存前统一做：将对抗样本 tensor clamp 到 [0,1]，再乘 255，再 .byte()（PyTorch）或 .astype(np.uint8)（NumPy）
检查 foolbox.PyTorchModel 初始化时的 bounds 参数是否和你图像预处理一致；例如用 ImageNet 的 [-2.5,2.5] 归一化，就不能设 bounds=(0,1)
用 PIL 保存时别直接传 float tensor，先转 PIL.Image.fromarray(...)；用 OpenCV 时确保通道顺序是 BGR，且输入是 HWC 格式
调试时打印 adv_img.min().item(), adv_img.max().item()，如果远超 [0,1]，说明 eps 太大或 clip 没生效

最常被忽略的是 bounds 和实际输入分布不匹配——它不会报错，但生成的图根本不像对抗样本，只是加了层模糊噪点。

以上就是本文的全部内容了，是否有顺利帮助你解决问题？若是能给你带来学习上的帮助，请大家多多支持golang学习网！更多关于文章的相关知识，也可关注golang学习网公众号。

资料下载

编程学习资料下载

精选编程（Golang、Python、Java、C++、JavaScript等）教程、电子书与示例源码，一键打包本地下载学习。

立即下载

Foolbox库：Python对抗样本生成教程

为什么 foolbox 的攻击在 PyTorch 模型上总报 NotImplementedError: Cannot differentiate through this function

foolbox 的 PGD 攻击不收敛、扰动看起来像噪声

用 foolbox 测 TensorFlow/Keras 模型时提示 AttributeError: 'Tensor' object has no attribute 'numpy'

生成的对抗样本保存后图像发灰、对比度崩坏

为什么 `foolbox` 的攻击在 PyTorch 模型上总报 `NotImplementedError: Cannot differentiate through this function`

`foolbox` 的 `PGD` 攻击不收敛、扰动看起来像噪声

用 `foolbox` 测 TensorFlow/Keras 模型时提示 `AttributeError: 'Tensor' object has no attribute 'numpy'`