登录
推荐 文章 Go 技术 课程 下载 专题 AI
首页 >  文章 >  软件教程

工具箱:DeepLearningToolbox如何从零搭建一个卷积神经网络

时间:2026-05-03 10:08:58 109浏览 收藏

欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《工具箱:DeepLearningToolbox如何从零搭建一个卷积神经网络》,这篇文章主要讲到等等知识,如果你对文章相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!

使用DeepLearningToolbox在MATLAB中从零构建CNN需五步:一、用imageInputLayer和normalizationLayer初始化输入;二、堆叠卷积-ReLU-池化三元组模块;三、接flattenLayer、fullyConnectedLayer、softmaxLayer和classificationLayer构成分类头;四、用trainingOptions配置Adam优化器等参数后调用trainNetwork训练;五、小数据集可迁移学习,加载预训练网络并微调顶层。

工具箱:DeepLearningToolbox如何从零搭建一个卷积神经网络

如果您希望使用 DeepLearningToolbox 从零开始搭建一个卷积神经网络,则需明确该工具箱在 MATLAB 环境中提供的一系列专用函数与模块化构建方式。以下是完成此任务的具体路径:

一、初始化网络架构并声明输入层

DeepLearningToolbox 要求网络以层数组(Layer Array)形式定义,输入层必须显式指定图像尺寸与通道数,以确保后续卷积操作能正确解析空间维度。输入层还承担归一化职责,避免原始像素值(0–255)导致梯度不稳定。

1、使用 imageInputLayer 创建输入层,设置 'InputSize' 为 [height width channels],例如处理 RGB 图像时设为 [224 224 3];

2、在输入层后添加 normalizationLayer,类型设为 'zscore' 或 'rescale-zero-one',确保输入分布可控;

3、将输入层与归一化层按顺序存入 layers 变量,作为网络结构的起始部分。

二、堆叠卷积-激活-池化三元组模块

每个特征提取阶段由卷积层提取局部模式、ReLU 激活引入非线性、池化层压缩空间尺寸构成。三者协同可逐层增强语义表达能力,同时控制参数总量。

1、调用 convolution2dLayer 设置滤波器数量(如 32)、卷积核大小(如 [3 3])、填充方式('same' 以保持尺寸);

2、紧接其后添加 reluLayer,不带参数,仅执行 f(x) = max(0, x);

3、再连接 maxPooling2dLayer,设置池化窗口为 [2 2]、步长为 2,实现下采样;

4、重复上述三步,依次构建第二、第三组模块,每组递增滤波器数量(如 64、128),形成深度特征金字塔。

三、接入全连接分类头并配置输出

经过多级卷积与池化后,高维特征图需展平为向量,再经全连接层映射至目标类别空间。输出层结构必须与任务标签维度严格一致,否则训练将报错。

1、使用 featureInputLayer 或隐式 flattenLayer 将三维特征图转换为一维向量;

2、添加 fullyConnectedLayer,输出维度设为类别总数(如 CIFAR-10 中为 10);

3、在全连接层后串联 softmaxLayer,将输出转化为概率分布;

4、末尾添加 classificationLayer,启用交叉熵损失计算与标签匹配校验。

四、配置训练选项并启动训练循环

训练行为由 trainingOptions 控制,其参数直接影响收敛速度、泛化能力与硬件资源占用。学习率衰减、批处理大小、验证频率等均需依据数据集规模与 GPU 显存进行权衡。

1、调用 trainingOptions,设置 'Solver' 为 'adam','InitialLearnRate' 为 0.001;

2、设定 'MiniBatchSize'(如 32 或 64),'MaxEpochs'(如 30),'ValidationData' 与 'ValidationFrequency';

3、启用 'Plots' 为 'training-progress',实时监控损失与准确率变化;

4、执行 trainNetwork 函数,传入 layers、trainingData、options 三要素,启动端到端训练流程。

五、加载预训练权重或冻结部分层进行迁移学习

当目标数据集较小时,直接从零训练易过拟合。DeepLearningToolbox 支持加载 ImageNet 预训练网络(如 AlexNet、ResNet-18)的部分权重,并冻结底层卷积参数,仅微调顶层分类器。

1、使用 alexnetresnet18 加载预训练网络,提取其 layers 字段;

2、定位至最后的全连接层,用 fullyConnectedLayer 替换原输出维度;

3、将新替换的层及其后的 softmaxLayer、classificationLayer 组成新尾部;

4、在 trainingOptions 中设置 'InitialLearnRate' 为更小值(如 1e-4),并将 'LayerWeights' 和 'LayerBiases' 的 'LearnRateFactor' 设为 0,冻结前若干层。

到这里,我们也就讲完了《工具箱:DeepLearningToolbox如何从零搭建一个卷积神经网络》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于MathWorks的知识点!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>