深度学习与智能硬件实训课程详情
该课程主要介绍 DL 的基础概念与训练方法,包括 CNN 的卷积计算、Padding 等核心机制。 在工程实践部分,以 ResNet50 迁移学习作为重点范例,完成网络结构改造、数据增强、训练与验证流程,形成从理论到实现的完整闭环。
课程背景与学习目标
《深度学习与智能硬件实训》围绕“从理论到可运行模型”的完整链路展开。 学习内容包含神经网络基础、卷积网络、训练与泛化策略,以及迁移学习在小样本场景中的应用。
课程训练强调两条主线:一是掌握核心概念与公式的可解释理解,二是在代码层完成模型搭建、训练、验证与结果分析。 课程成绩为 98,并形成可复用的学习笔记与程序化实践记录。
学习目标
建立 AI/ML/DL 的层级认知,理解监督学习、无监督学习与分类/聚类/回归的边界。
模型基础
掌握人工神经元、激活函数、损失函数、梯度下降与误差反向传播的训练逻辑。
核心网络
围绕 CNN 的卷积、池化、全连接、参数共享与多通道卷积完成结构化学习。
工程能力
以 ResNet50 迁移学习工程范例完成“数据-模型-验证”闭环实践。
基础概念与方法框架
| 概念 | 定位 | 课程中的关注点 |
|---|---|---|
| 人工智能(AI) | 总体学科目标:让系统具备智能行为 | 理解任务建模与应用场景边界 |
| 机器学习(ML) | AI 的方法分支:用数据驱动模型学习 | 监督/无监督学习、分类/聚类/回归 |
| 深度学习(DL) | ML 的神经网络分支 | 多层网络表示学习与端到端优化 |
人工神经元:z = w1x1 + w2x2 + ... + wnxn + b
输出:y = f(z)
训练目标:最小化损失函数 Loss(y_pred, y_true)
参数 vs 超参数
参数通过训练得到(如权重 w、偏置 b);超参数在训练前设定(如 epoch、batch size、学习率)。
数据集划分
训练集用于拟合参数,验证集用于调参与防过拟合,测试集用于最终泛化评估。
过拟合与欠拟合
过拟合是训练好但泛化差;欠拟合是训练阶段就无法有效拟合数据规律。
学习率与收敛
学习率控制更新步长,过大易震荡,过小收敛慢;通常需结合验证表现动态调节。
CNN 与训练关键点
关键点 1:典型 CNN 结构与参数共享
课程中的典型卷积网络由输入层、卷积层、池化层、全连接层和输出层组成。 卷积核在空间维度共享参数,显著减少参数量并提升大规模数据下的训练效率。
关键点 2:训练机制与泛化控制
| 模块 | 作用 | 课程实践关注点 |
|---|---|---|
| 损失函数 | 衡量预测与标签误差 | 作为反向传播优化的直接目标 |
| 反向传播 | 按梯度更新网络参数 | 理解“前向计算 + 反向求导”流程 |
| Batch Normalization | 稳定层输入分布、加速收敛 | 提高训练稳定性 |
| Dropout | 抑制过拟合 | 提升模型在新样本上的泛化能力 |
关键点 3:工程训练技巧
在卷积网络训练中,常结合数据增强、样本平衡、minibatch 训练、动态学习率与预训练模型。 对小样本任务而言,迁移学习通常更快收敛、资源需求更低,也更符合课堂工程实践场景。
ResNet50 迁移学习工程范例(重点)
本课程的工程实践重点采用 ResNet50 迁移学习案例展开。 该范例面向“小样本 + 快速收敛”的典型任务,核心目标是复用预训练特征并完成目标数据集的高效微调。
Step 1:数据准备与划分
使用 imageDatastore 读取按类别组织的数据集,随机划分训练集与验证集并检查类别分布。
Step 2:网络结构改造
加载预训练 resnet50,替换末端全连接层、softmax 层与分类输出层,使网络匹配目标类别数。
Step 3:数据增强与训练配置
配置旋转、翻转、错切等增强策略,并设置 Adam 优化器、学习率、batch size、epoch 等训练参数。
Step 4:验证与结果分析
用验证集计算准确率并绘制混淆矩阵,形成“可复现训练 + 可解释评估”的工程闭环。
迁移学习流程:
加载数据 -> 划分训练/验证 -> 加载预训练网络
-> 替换分类层 -> 数据增强 -> 训练网络 -> 验证与混淆矩阵分析
课程收获与复盘
理论理解
从神经元到网络训练的链路更完整,能解释常见术语及训练阶段核心决策。
代码能力
能够阅读并整理课程中的 MATLAB 深度学习程序,理解每个训练步骤的工程作用。
实验方法
形成了先验证数据、再设计网络、最后用指标反推问题的实验习惯。
迁移思维
对于小样本任务,优先考虑迁移学习与数据增强,兼顾效果、训练时长与硬件成本。
迁移学习程序预览
下方预览文件为 第八章迁移学习代码整理.m 的公开副本,展示了我对迁移学习流程的学习与实现。
程序内容覆盖数据加载、ResNet50 结构改造、数据增强、训练与验证等完整步骤。
正在加载迁移学习代码预览...