课程：数字图像处理｜成绩：94 ｜授课教师：李竹教授（电子信息学院副院长）

数字图像处理课程学习总结

数字图像处理是本科阶段对我影响最深的专业课程之一。李竹教授在课程中系统讲授传统图像处理方法，并将理论推导与代码实践、工程案例紧密结合，使我建立了从问题定义到算法落地的完整认知。围绕连通域分析、SIFT/HOG 等方法的学习与实践，我进一步认识到在 AI-Coding 时代，工程能力的核心在于技术路线设计、策略建模与结果验证，而不仅是代码实现本身。相较于依赖专用硬件的平台型课程，本课程可在个人计算环境中快速迭代并获得及时反馈，这也促使我在课外持续开展图像处理实验与项目验证。

关键词：图像增强、阈值分割、形态学、Hough、SIFT/HOG、透视变换；书法图像字块分割、钢琴演奏手部识别

课内传统算法：核心框架

课内学习以“图像表示 -> 基础运算 -> 特征与识别 -> 频域与编码”为主线展开。复习提纲和课堂代码阅读题让我把每个模块从“定义层”推进到“可手算、可解释、可实现”。

模块	课内核心点	我重点掌握的内容
图像基础	采样、量化、编码；二值/灰度/彩色图；像素邻域与连通域	能快速判断图像表示方式对后续算法复杂度与效果的影响
颜色与变换	RGB、HSV/HSI、YCbCr；几何变换与插值	理解为何压缩和检测中常做颜色空间分离，以及透视矫正的工程意义
增强与分割	卷积滤波、中值滤波、直方图变换、Otsu 二值化、形态学	能围绕噪声类型和目标形态设计预处理链路
特征与检测	HOG/SIFT、Canny、最小二乘法、霍夫变换	能比较算法优缺点并进行场景匹配，不只停留在调用函数
识别与编码	kNN/k-means、背景差分、JPEG 流程（DCT/量化/编码）	建立了从“特征提取”到“分类识别”再到“压缩传输”的整体认知

DIP 课内知识主线：
图像数字化 -> 图像增强与二值化 -> 形态学与连通域 -> 边缘/直线检测
-> 特征提取(HOG/SIFT) -> 几何变换与透视校正 -> 识别与压缩编码

课内知识：算法对比与方法意识

HOG vs SIFT

HOG（方向梯度直方图）更偏整体轮廓描述（行人检测），SIFT更偏关键点匹配；后者具备较强旋转与尺度鲁棒性。

最小二乘 vs 霍夫

最小二乘精度高且快，但怕离群点；霍夫更稳健、可检多线，代价是计算开销更大。

卷积滤波 vs 中值滤波

卷积适合平滑随机噪声；中值滤波对椒盐噪声抑制更稳定，能较好保留边缘。

Otsu 阈值分割

通过最大化类间方差自动选阈值，是灰度前景/背景分离的高频基础方法。

课外实践：课堂练习闭环（1~8）

基于课堂练习整理，我完成了从目标计数、形态学清理、连通域筛选，到透视矫正、霍夫直线检测、伽马增强、颜色目标识别的一整套实践。这些练习让我形成了“先预处理，再检测/分割，最后结果复盘”的稳定工程习惯。

练习阶段	代表任务	方法链路
练习4-5	倾斜书本透视矫正	边缘检测 + 颜色空间掩膜 -> 角点定位 -> 透视变换恢复矩形视图
练习6	工件轮廓主线提取	Canny -> 边缘修复 -> HoughLinesP -> 聚类 -> 最小二乘拟合
练习7	图像伽马矫正 UI	归一化 -> 幂变换 -> 曲线可视化 -> 交互调参
练习8	红色杯盖识别	BGR->HSV -> 双区间红色掩膜 -> 开闭运算 -> 最大轮廓定位