首页 > 文章 > 软件教程

工具箱：DeepLearningToolbox如何从零搭建一个卷积神经网络

时间：2026-05-03 10:08:58 109浏览收藏

欢迎各位小伙伴来到golang学习网，相聚于此都是缘哈哈哈！今天我给大家带来《工具箱：DeepLearningToolbox如何从零搭建一个卷积神经网络》，这篇文章主要讲到等等知识，如果你对文章相关的知识非常感兴趣或者正在自学，都可以关注我，我会持续更新相关文章！当然，有什么建议也欢迎在评论留言提出！一起学习！

使用DeepLearningToolbox在MATLAB中从零构建CNN需五步：一、用imageInputLayer和normalizationLayer初始化输入；二、堆叠卷积-ReLU-池化三元组模块；三、接flattenLayer、fullyConnectedLayer、softmaxLayer和classificationLayer构成分类头；四、用trainingOptions配置Adam优化器等参数后调用trainNetwork训练；五、小数据集可迁移学习，加载预训练网络并微调顶层。

如果您希望使用 DeepLearningToolbox 从零开始搭建一个卷积神经网络，则需明确该工具箱在 MATLAB 环境中提供的一系列专用函数与模块化构建方式。以下是完成此任务的具体路径：

一、初始化网络架构并声明输入层

DeepLearningToolbox 要求网络以层数组（Layer Array）形式定义，输入层必须显式指定图像尺寸与通道数，以确保后续卷积操作能正确解析空间维度。输入层还承担归一化职责，避免原始像素值（0–255）导致梯度不稳定。

1、使用 imageInputLayer 创建输入层，设置 'InputSize' 为 [height width channels]，例如处理 RGB 图像时设为 [224 224 3]；

2、在输入层后添加 normalizationLayer，类型设为 'zscore' 或 'rescale-zero-one'，确保输入分布可控；

3、将输入层与归一化层按顺序存入 layers 变量，作为网络结构的起始部分。

二、堆叠卷积-激活-池化三元组模块

每个特征提取阶段由卷积层提取局部模式、ReLU 激活引入非线性、池化层压缩空间尺寸构成。三者协同可逐层增强语义表达能力，同时控制参数总量。

1、调用 convolution2dLayer 设置滤波器数量（如 32）、卷积核大小（如 [3 3]）、填充方式（'same' 以保持尺寸）；

2、紧接其后添加 reluLayer，不带参数，仅执行 f(x) = max(0, x)；

3、再连接 maxPooling2dLayer，设置池化窗口为 [2 2]、步长为 2，实现下采样；

4、重复上述三步，依次构建第二、第三组模块，每组递增滤波器数量（如 64、128），形成深度特征金字塔。

三、接入全连接分类头并配置输出

经过多级卷积与池化后，高维特征图需展平为向量，再经全连接层映射至目标类别空间。输出层结构必须与任务标签维度严格一致，否则训练将报错。

1、使用 featureInputLayer 或隐式 flattenLayer 将三维特征图转换为一维向量；

2、添加 fullyConnectedLayer，输出维度设为类别总数（如 CIFAR-10 中为 10）；

3、在全连接层后串联 softmaxLayer，将输出转化为概率分布；

4、末尾添加 classificationLayer，启用交叉熵损失计算与标签匹配校验。

四、配置训练选项并启动训练循环

训练行为由 trainingOptions 控制，其参数直接影响收敛速度、泛化能力与硬件资源占用。学习率衰减、批处理大小、验证频率等均需依据数据集规模与 GPU 显存进行权衡。

1、调用 trainingOptions，设置 'Solver' 为 'adam'，'InitialLearnRate' 为 0.001；

2、设定 'MiniBatchSize'（如 32 或 64），'MaxEpochs'（如 30），'ValidationData' 与 'ValidationFrequency'；

3、启用 'Plots' 为 'training-progress'，实时监控损失与准确率变化；

4、执行 trainNetwork 函数，传入 layers、trainingData、options 三要素，启动端到端训练流程。

五、加载预训练权重或冻结部分层进行迁移学习

当目标数据集较小时，直接从零训练易过拟合。DeepLearningToolbox 支持加载 ImageNet 预训练网络（如 AlexNet、ResNet-18）的部分权重，并冻结底层卷积参数，仅微调顶层分类器。

1、使用 alexnet 或 resnet18 加载预训练网络，提取其 layers 字段；

2、定位至最后的全连接层，用 fullyConnectedLayer 替换原输出维度；

3、将新替换的层及其后的 softmaxLayer、classificationLayer 组成新尾部；

4、在 trainingOptions 中设置 'InitialLearnRate' 为更小值（如 1e-4），并将 'LayerWeights' 和 'LayerBiases' 的 'LearnRateFactor' 设为 0，冻结前若干层。

到这里，我们也就讲完了《工具箱：DeepLearningToolbox如何从零搭建一个卷积神经网络》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于MathWorks的知识点！

MathWorks