实用MATLAB图像和视频处理


实用MATLAB图像和视频处理

文章插图
实用MATLAB图像和视频处理【实用MATLAB图像和视频处理】《实用MATLAB图像和视频处理》是2013年出版的图书 , 作者是Oge Marques 。
基本介绍书名:实用MATLAB图像和视频处理
作者:Oge Marques
译者:章毓晋
ISBN:9787302339168
定价:69元
出版时间:2013-12-12
装帧:平装
图书简介介绍图像和视频处理技术并辅以MATLAB算法实现的书籍 。本书是一本楚成王 。目前介绍图像处理的书籍很多 , 也有一些介绍视频处理的书籍 , 但将两者结合在一本书中的还不太多 。视频处理是对图像处理的一种扩展 , 近年来视频的广泛套用也促进了图像技术的推广 。另外 , 学习图像和视频处理技术除了要理解原理 , 对算法进行实现也很重要 。这一方面可帮助读者进一步理解原理 , 另一方面也有助于藉助图像和视频处理技术解决实际问题 。MATLAB是面向科学和工程计算的软体平台 , 用其来展示现图像和视频处理技术既方便又实用 。本书是作为一本实用教材来编写的 , 没有过多地介绍图像和视频处理技术中的数学公式 , 而是注重方法的概念和算法的效果 。全书每章都以“将学习什幺?”开始 , 介绍本章要分析的主要问题;每章末尾都有“学到了什幺?” , 总结归纳该章的要点 。大多数章在介绍图像和视频处理技术后 , 还提供了相应的MATLAB教程 , 以一步一步引导读者实现相应技术的算法 , 并且可以看到处理的结果 。另外 , 每章都有“了解更多” , 给出深入学习或套用的参考(很多章还提供了相应的网站或网页 , 可以获得更新的信息) 。图书目录表 格 列 表编号表 题页码表3.1MATLAB数据类别26表3.2MATLAB数组和矩阵算术操作29表3.3MATLAB特殊的矩阵操作示例29表3.4IPT支持的特殊算术函式30表3.5关係操作符30表3.6逻辑操作符30表3.7逻辑函式30表3.8选出来的内置变数和内置常量31表4.1执行图像数据类转换的IPT函式48表4.2执行图像数据类转换的IPT函式50表7.1对所选仿射变换係数的汇总90表8.1线性点变换示例(图8.4中的图像和曲线)110表9.1一个直方图示例123表9.2均衡化的直方图:数值127表9.3期望的直方图129表9.4直接直方图规定化:汇总130表9.5结果直方图130表10.1卷积模板示例149表13.1bwmorph支持的操作228表16.1用于CIE XYZ和CIELAB彩色空间的IPT函式283表16.2用于ICC配置操作的IPT函式283表16.3对应RGB立方体的8个顶点的代表性彩色的R、G和B值284表16.4MATLAB中的彩色映射289表17.1三幅具有不同质量因子的JPEG图像的客观质量测度315表17.2五幅具有不同质量因子的JPEG图像的压缩率317表17.3五幅具有不同质量因子的JPEG图像的客观质量测度317表18.1RST不变矩325表18.2标记区域的性质325表18.3图18.16中三幅图像的统计纹理描述符333表18.4图18.16中三幅图像的统计纹理描述符(基于共生矩阵)335表18.5特徵提取结果表336表20.1模拟彩色电视系统的参数368表20.2代表性的数字视频格式374表20.3ITU-R的BT.601-5建议的参数375表20.4代表性的数字视频格式目 录第1部分?图 像 处 理第1章 引言和概述 31.1 动机 31.2 基本概念和术语 41.3 典型图像处理操作示例 51.4 数字图像处理系统的组成 81.5 机器视觉系统 91.6 资源 101.7 练习题 13第2章 图像处理基础 15 2.1 数字图像表达 152.1.1 二值(1比特)图像 162.1.2 灰度(8比特)图像 172.1.3 彩色图像 172.1.4 压缩 182.2 图像档案格式 192.3 基本术语 202.4 图像处理操作概述 212.4.1 全局(点)操作 222.4.2 面向邻域的操作 222.4.3 结合多幅图像的操作 232.4.4 变换域操作 23第3章 MATLAB基础 253.1 MATLAB介绍 253.2 MATLAB的基本元素 253.2.1 工作环境 263.2.2 数据种类 263.2.3 MATLAB中的数组和矩阵索引 263.2.4 标準数组 273.2.5 命令行操作 273.3 编程工具:脚本和函式 273.3.1 M-档案 283.3.2 操作符 293.3.3 重要变数和常量 303.3.4 数字表示 313.3.5 流程控制 313.3.6 代码最佳化 313.3.7 输入和输出 313.4 图形和可视化 313.5 教程3.1:MATLAB——导览 323.6 教程3.2:MATLAB数据结构 343.7 教程3.3:MATLAB编程 393.8 练习题 43第4章 图像处理工具箱一览 454.1 图像处理工具箱:概述 454.2 基本功能和特性 454.2.1 显示有关图像档案的信息 464.2.2 读一个图像档案 474.2.3 数据类和数据转换 484.2.4 显示一幅图像的内容 504.2.5 发掘一幅图像的内容 514.2.6 将结果图像写入一个档案 524.3 教程4.1:MATLAB图像处理工具箱——导游 534.4 教程4.2:基本图像操作 544.5 练习题 58第5章 图像感测和採集 605.1 介绍 605.2 光、彩色和电磁频谱 615.2.1 光和电磁频谱 615.2.2 图像种类 615.2.3 光和彩色感知 625.2.4 彩色编码和表达 635.3 图像採集 645.3.1 图像感测器 645.3.2 相机光学器件 665.4 图像数位化 675.4.1 採样 685.4.2 量化 695.4.3 空间和灰度解析度 695.5 练习题 72第6章 算术和逻辑运算 746.1 算术运算:基础和套用 746.1.1 加法 746.1.2 减法 766.1.3 乘法和除法 786.1.4 结合若干个算术操作 786.2 逻辑运算:基础和套用 796.3 教程6.1:算术运算 816.4 教程6.2:逻辑运算和感兴趣区域处理 856.5 练习题 87第7章 几何操作 89 7.1 介绍 897.2 映射和仿射变换 907.3 插值方法 927.3.1 对插值的需求 927.3.2 简单的插值方法 937.3.3 零阶(最近邻)插值 937.3.4 一阶(双线性)插值 937.3.5 高阶插值 937.4 使用MATLAB进行几何操作 947.4.1 放大、缩小和调整大小 947.4.2 平移 957.4.3 旋转 957.4.4 裁剪 957.4.5 翻转 957.5 其他几何操作和套用 957.5.1 扭曲 957.5.2 非线性图像变换 967.5.3 变形 977.5.4 接缝焊接 977.5.5 图像配準 987.6 教程7.1:图像裁剪、大小调整、翻转和旋转 987.7 教程7.2:空间变换和图像配準 1017.8 练习题 106第8章 灰度变换 1088.1 介绍 1088.2 灰度(点)变换综述 1098.3 点变换示例 1118.3.1 对比度操纵 1118.3.2 求反 1128.3.3 幂律(伽玛)变换 1128.3.4 对数变换 1138.3.5 分段线性变换 1148.4 指定变换函式 1158.5 教程8.1:灰度变换 1178.6 练习题 121第9章 直方图处理 1229.1 图像直方图:定义和示例 1229.2 计算图像的直方图 1239.3 解释图像的直方图 1239.4 直方图均衡化 1259.5 直接直方图规定化 1299.6 其他直方图修改技术 1319.6.1 直方图滑动 1319.6.2 直方图伸展 1319.6.3 直方图收缩 1339.7 教程9.1:图像直方图 1339.8 教程9.2:直方图均衡化和规定化 1369.9 教程9.3:其他直方图修改技术 1389.10 练习题 142第10章 邻域处理 14510.1 介绍 14510.2 卷积和相关 14510.2.1 一维域中的卷积 14610.2.2 二维域中的卷积 14710.2.3 相关 14910.2.4 处理图像边界 15010.3 图像平滑(低通滤波器) 15110.3.1 均值滤波器 15210.3.2 变型 15310.3.3 高斯模糊滤波器 15410.3.4 中值和其他非线性滤波器 15510.4 图像锐化(高通滤波器) 15610.4.1 拉普拉斯运算元 15610.4.2 複合拉普拉斯运算元模板 15710.4.3 方向差分滤波器 15810.4.4 非锐化掩膜 15810.4.5 高频提升滤波 15810.5 感兴趣区域处理 158 10.6 结合空间增强方法 15910.7 教程10.1:卷积和相关 15910.8 教程10.2:空间平滑滤波器 16110.9 教程10.3:空间锐化滤波器 16310.10 练习题 167第11章 频域滤波 16911.1 介绍 16911.2 傅立叶变换:数学基础 17011.2.1 基本概念 17011.2.2 2-D离散傅立叶变换:数学公式 17111.2.3 傅立叶变换性质汇总 17211.2.4 其他数学变换 17411.3 低通滤波 17411.3.1 理想LPF 17411.3.2 高斯LPF 17511.3.3 巴特沃斯LPF 17711.4 高通滤波 17911.4.1 理想HPF 17911.4.2 高斯HPF 17911.4.3 巴特沃斯HPF 18011.4.4 高频增强 18011.5 教程11.1:2-D傅立叶变换 18011.6 教程11.2:频域里的低通滤波器 18211.7 教程11.3:频域高通滤波器 18511.8 练习题 190第12章 图像恢复 19112.1 对图像退化和恢复问题建模 19112.2 噪声和噪声模型 19212.2.1 噪声机率密度函式示例 19212.2.2 噪声估计 19612.3 使用空域技术的噪声消除 19712.3.1 均值滤波器 19712.3.2 序统计滤波器 19912.3.3 自适应滤波器 20112.4 使用频域技术的噪声消除 20212.4.1 周期性噪声 20212.4.2 带阻滤波器 20212.4.3 带通滤波器 20312.4.4 陷波滤波器 20412.5 图像去模糊技术 20512.6 教程12.1:使用空域技术的噪声消除 20812.7 练习题 214第13章 形态图像处理 21613.1 介绍 21613.2 基本概念和操作 21613.3 膨胀和腐蚀 21913.3.1 膨胀 22013.3.2 腐蚀 22113.4 複合操作 22313.4.1 开启 22313.4.2 闭合 22413.4.3 击中-击不中变换 22513.5 形态滤波器 22613.6 基本形态算法 22713.6.1 边界提取 22913.6.2 区域填充 23013.6.3 连通组元提取和标记 23113.7 灰度形态学 23213.7.1 膨胀和腐蚀 23213.7.2 开启和闭合 23313.7.3 高帽和低帽变换 23313.8 教程13.1:二值形态图像处理 23413.9 教程13.2:基本形态算法 237 13.10 练习题 240第14章 边缘检测 24114.1 问题的提出 24114.2 基本概念 24114.3 一阶导数边缘检测 24314.4 二阶导数边缘检测 24714.5 坎尼边缘检测器 24914.6 边缘连线和边界检测 25014.7 教程14.1:边缘检测 25314.8 练习题 260第15章 图像分割 26115.1 介绍 26115.2 基于强度的分割 26215.2.1 图像阈值化 26215.2.2 全局阈值化 26315.2.3 照明和噪声对阈值化的影响 26415.2.4 局部阈值化 26615.3 基于区域的分割 26615.3.1 区域生长 26715.3.2 区域分裂合併 26915.4 分水岭分割 27015.5 教程15.1:图像阈值化 27115.6 练习题 276第16章 彩色图像处理 27716.1 彩色心理物理学 27716.1.1 基本概念 27716.1.2 CIE的XYZ色度图 27916.1.3 感知均匀彩色空间 28216.1.4 ICC配置 28316.2 彩色模型 28316.2.1 RGB彩色模型 28416.2.2 CMY和CMYK彩色模型 28516.2.3 HSV彩色模型 28516.2.4 YIQ(NTSC)彩色模型 28616.2.5 YCbCr彩色模型 28716.3 彩色图像在MATLAB中的表示 28716.3.1 RGB图像 28716.3.2 索引图像 28816.4 伪彩色图像处理 29016.4.1 强度切割 29116.4.2 灰度到彩色变换 29216.4.3 频域伪彩色化 29216.5 全彩色图像处理 29316.5.1 彩色变换 29416.5.2 直方图处理 29516.5.3 彩色图像平滑和锐化 29616.5.4 彩色噪声消除 29616.5.5 基于彩色的图像分割 29716.5.6 彩色边缘检测 29916.6 教程16.1:伪彩色图像处理 30016.7 教程16.2:全彩色图像处理 30116.8 练习题 304第17章 图像压缩和编码 30617.1 介绍 30617.2 基本概念 30617.2.1 冗余 30717.2.2 图像编码和解码模型 30817.3 无损和有损压缩技术 30917.3.1 无损压缩技术 30917.3.2 有损压缩技术 31017.4 图像压缩标準 31117.4.1 二值图像压缩标準 31117.4.2 连续色调静止图像压缩标準 31117.4.3 JPEG 312 17.4.4 JPEG2000 31217.4.5 JPEG-LS 31317.5 图像质量测度 31317.5.1 主观质量测量 31317.5.2 客观质量测量 31417.6 教程17.1:图像压缩 315第18章 特徵提取和表达 31918.1 介绍 31918.2 特徵矢量和矢量空间 31918.3 二值目标特徵 32118.3.1 面积 32118.3.2 重心 32118.3.3 最小二阶矩的轴 32118.3.4 投影 32218.3.5 欧拉数 32318.3.6 周长 32318.3.7 细度比例 32318.3.8 偏心率 32418.3.9 宽高比 32418.3.10 矩 32418.4 边界描述符 32618.4.1 链码、弗里曼码和形状数 32718.4.2 边界标誌 32918.4.3 傅立叶描述符 33018.5 基于直方图(统计的)特徵 33118.6 纹理特徵 33218.7 教程18.1:特徵提取和表达 33518.8 练习题 338第19章 视觉模式识别 33919.1 介绍 33919.2 基础 33919.2.1 一个视觉模式分类器的设计和实现 33919.2.2 模式和模式类 34119.2.3 数据预处理 34219.2.4 训练和测试集 34219.2.5 混淆矩阵 34319.2.6 系统误差 34319.2.7 命中率 , 虚警率 , ROC曲线 34319.2.8 查準率和查全率 34419.2.9 距离和相似性测度 34619.3 统计模式分类技术 34719.3.1 最小距离分类器 34819.3.2 k-最近邻分类器 34919.3.3 贝叶斯分类器 34919.4 教程19.1:模式分类 35019.5 练习题 355第2部分?视 频 处 理第20章 视频基础 35920.1 基本概念和术语 35920.2 单色模拟视频 36320.2.1 模拟视频光栅 36320.2.2 消隐区间 36420.2.3 同步信号 36420.2.4 複合单色模拟视频的频谱内容 36520.3 视频中的彩色 36520.4 模拟视频标準 36720.4.1 NTSC 36720.4.2 PAL 36820.4.3 SECAM 36820.4.4 HDTV 36820.5 数字视频基础 36920.5.1 数字视频的优点 36920.5.2 一个数字视频序列的参数 37020.5.3 音频分量 37020.6 模-数转换 37120.7 彩色表达和色度亚採样 37320.8 数字视频格式和标準 374 20.8.1 Rec.601数字视频格式 37420.8.2 常用中间格式 37620.8.3 源中间格式 37620.9 视频压缩技术和标準 37620.10 在MATLAB中的视频处理 37820.10.1 读取视频档案 37820.10.2 处理视频档案 37820.10.3 播放视频档案 37920.10.4 编写视频档案 37920.11 教程20.1:MATLAB中的基本数字视频操作 37920.12 教程20.2:使用YUV视频数据 38320.13 练习题 387第21章 视频採样率和标準转换 38921.1 视频採样 38921.2 採样率转换 38921.3 标準转换 39021.3.1 去隔行 39021.3.2 PAL和NTSC信号间的转换 39121.3.3 彩色空间转换 39221.3.4 宽高比转换 39321.3.5 3﹕2下拉 39321.4 教程21.1:行下转换 39421.5 教程21.2:去隔行 39521.6 教程21.3:从NTSC到PAL的转换 40021.7 教程21.4:3﹕2下拉 40121.8 练习题 402第22章 数字视频处理技术和套用 40322.1 运动估计和运动补偿基础 40322.2 运动估计的一般方法 40522.2.1 运动表达 40622.2.2 运动估计準则 40622.2.3 最佳化方法 40722.3 运动估计算法 40722.3.1 穷举搜寻块匹配算法 40722.3.2 快速算法 40922.3.3 分层块匹配算法 41022.3.4 相位关联方法 41122.4 视频增强和降噪 41122.4.1 视频降噪 41122.4.2 帧间滤波技术 41222.5 案例研究:複杂背景中的目标分割和跟蹤 41322.6 教程22.1:基于块的运动估计 41522.7 教程22.2:帧内和帧间滤波技术 41922.8 练习题 422附录A 人类视觉感知 423A.1 介绍 423A.2 人眼 423A.3 人类视觉的特性 426A.3.1 解析度、观察距离和观察角 426A.3.2 细节和锐度感知 429A.3.3 光学转移函式和调製转移函式 429A.3.4 亮度感知 429A.3.5 对比度和对比敏感度函式 431A.3.6 运动感知 432A.3.7 时空解析度和频率回响 433A.3.8 掩膜 434A.4 关于人类视觉系统知识的意义和套用 435附录B 图形用户界面开发 437B.1 介绍 437 B.2 GUI档案结构 437B.3 传递系统控制 438B.4 UserData目标 440B.5 一个工作的GUI演示 441B.6 结束语 442参考文献 443索引 450前言译 者 序本书是一本介绍图像和视频处理技术并辅以MATLAB算法实现的书籍 。目前介绍图像处理的书籍很多 , 也有一些介绍视频处理的书籍 , 但将两者结合在一本书中的还不太多 。视频处理是对图像处理的一种扩展 , 近年来视频的广泛套用也促进了图像技术的推广 。另外 , 学习图像和视频处理技术除了要理解原理 , 对算法进行实现也很重要 。这一方面可帮助读者进一步理解原理 , 另一方面也有助于藉助图像和视频处理技术解决实际问题 。MATLAB是面向科学和工程计算的软体平台 , 用其来展示现图像和视频处理技术既方便又实用 。本书是作为一本实用教材来编写的 , 没有过多地介绍图像和视频处理技术中的数学公式 , 而是注重方法的概念和算法的效果 。全书每章都以“将学习什幺?”开始 , 介绍本章要分析的主要问题;每章末尾都有“学到了什幺?” , 总结归纳该章的要点 。大多数章在介绍图像和视频处理技术后 , 还提供了相应的MATLAB教程 , 以一步一步引导读者实现相应技术的算法 , 并且可以看到处理的结果 。另外 , 每章都有“了解更多” , 给出深入学习或套用的参考(很多章还提供了相应的网站或网页 , 可以获得更新的 信息) 。本书从结构上看 , 共有22章和两个附录 。全书共有编了号的图323个、表格35个、公式284个 , 练习题114个 。另外还有插图列表、表格列表、参考文献目录和索引术语 。全书译成中文约合747千字 。本书可作为相关专业本科生和其他专业研究生学习图像技术的课程教材 , 也可供从事相关领域科技开发和套用的技术人员自学参考 。本书的翻译基本忠实于原来的结构和文字风格 。根据中文书籍规範 , 将序言、前言、致谢、插图列表和表格列表均移到目录前 。另外 , 对原书的索引 , 考虑中文习惯进行了一些调整 , 并重新按中文次序进行了排列 , 以方便使用 。本书作者将全书分为了两个单元:图像处理(第1~19章)和视频处理(第20~22章) 。据译者从教学角度看 , 似可分为4个部分:(1)基础概述(包括第1、2、3、4章) , (2)图像处理(包括第5、6、7、8、9、10、11、12、16、17章) , (3)图像分析(包括第13、14、15、18、19章) , (4)视频处理(包括第20、21、22章) 。可使用前两部分作为一门40~48学时的入门图像技术课程的教材 , 而使用后两部分作为一门30~36学时的后续图像技术课程的教材 。感谢清华大学出版社编辑的精心组稿、认真审阅和细心修改 。最后 , 作者感谢妻子何芸、女儿章荷铭以及父母家人在各方面的理解和支持 。序 言今年早些时候 , 在为办公室搬迁而打包时 , 我震惊地发现我的很多书(很多情况下是出版商免费送给我用于评估和潜在用途的)都是仿製品:书中的材料都是从多年甚至几十年前的教材中综合和重新包装而来的 。Oge Marque的这本书不是仿製品 , 儘管其许多题材已经存在多年了 。她包含经过深思熟虑而彙编出来的材料 , 与当今成像科学、成像技术、图像理解 , 尤其是图像处理的学生非常相关 。成像是我主要的专业领域 。我对这本书很感兴趣 , 因为成像和图像处理近年来共同发展 。一些成像的方式(计算成像是首先想到的流行语)假定将有(事实上必须)对由感测器系统所收集原始信息的后检测处理 。确实 , 如果没有关键的后处理操作 , 感测器可能给出对观察者很少或根本没有意义的输出 。归根结底 , 图像处理在商业化的大规模生产系统中是由特殊的硬体实现的 。而在一个成像系统的研究和开发阶段 , 处理几乎都是使用MATLAB来实现的 。Marque的这本书通过直接将所描述的许多处理操作与MATLAB相联繫来解决这个问题 。已有大量的文本介绍数字图像处理操作和算法 。但是 , 没有一本书像这本书所做的那样强调人类视觉系统以及它与机器视觉系统之间的相互作用和相互比较 。该书包括丰富的实用材料和一个最新的宝贵参考文献列表 , 其中有杂誌、期刊和网站 。我希望看到该书的再版中还有对应的更新列表 。对教师有价值的还有她包含许多现代教材所具有的特徵 , 简洁的各章摘要回答了“学到了什幺?”的问题 。教程圈点文字 , 引导学生以一个主动学习的过程来了解重要的材料 。我写这个序言不仅是因为我认为这本书很好地考虑了其所预期的图像处理读者 , 而且因为我看到它影响了我自己学生的思维 , 这些学生从物理和技术的角度对成像系统感兴趣 , 但他们必须理解成像系统和图像处理系统之间的联繫 。William T. RHODES是乔治理工学院电气和计算机工程荣誉退休教授 。他在2005年加入了佛罗里达大西洋大学电气工程学院并成为学校成像技术中心的副主任 。他是美国光学工程学会和国际光学工程协会的会员 , 斯普林格光学科学系列的主编和线上刊物“SPIE评论”的主编 。前言在三十多年中 , 使用计算机来仿真人类视觉系统某些属性的前景一直让科学家、工程师和数学家感兴趣 , 使得图像处理成为套用计算机科学研究中发展最快的领域之一 。在过去的15年中 , 图像和视频处理的领域经历了巨大的增长并变得更流行和方便 。这种增长由若干个因素所驱动:广泛使用和价格相对低廉的硬体;各种图像和视频编辑、操作和处理的软体工具;网路的流行和它对视觉信息的高度重视 , 这是对使用过时胶片相机摄影的一次真正革命;电影工业的发展 , 以及人们观看、记录、分享电视节目和视频短片方式的突破性变化 。方法/方式本书对图像和视频处理中最重要的主题提供了一个实用的介绍 , 并使用MATLAB(和它的图像处理工具箱)作为工具来展示相关技术和算法 。“实用”一词在书名中出现并不是指覆盖了这些领域中最新的消费类电子产品;这方面的知识充其量是肤浅的且将在本书出版后不久(甚至在此之前!)被淘汰 。“实用”一词应该被解读为“让读者/学生藉助从书中获得的知识来制定切实可行的项目 , 即工作原型” 。它还有另一个含义 , 就是採用“刚刚足够的数学”理念 , 即更关注书中所描述技术的计算、算法和概念内容 , 而不是过度的数学形式主义 。因此 , 本书不仅适合其原有的目标客群作为教材使用(如计算机科学、计算机工程、电子工程和相关课程的高年级本科和低年级研究生) , 而且也适合使用MATLAB , 具有坚实的计算和编程技能 , 且希望自学图像和视频处理基础的研究者和实践者 。本书主要特点* 是将图像处理、视频处理以及面向MATLAB的对图像和视频算法和技术进行试验相结合的第一本书 。* 对图像和视频处理技术基本主题的全面、最新、技术上準确和实用的覆盖 。* 37个MATLAB教程可用来作为个人使用MATLAB探究图像和视频处理技术的逐步指南 , 也可用来由使用本书的教师作为课程的实验室作业 。* 为说明和总结文中描述的主要技术和概念 , 使用了330多幅图片和30个表格 。* 本书採用了“刚刚足够的数学”理念 。许多学生害怕面对非常强调技术的数学方面的图像和视频处理书籍 。本书通过在不牺牲解释的完整性条件下仅提供能完全理解一个技术所需的最少量的数学来解决这个问题 。* 本书强调并鼓励实际的实验 。在介绍了一个主题后 , 邀请读者自己操作 , 从而增强和拓展他们刚学习过的东西并在相同主题下探索新的路径 。* 本书被设计来回答第一次接触这个主题的学生/读者可能提出的最基本问题 。它基于我讲授图像和视频处理20年的经历/经验以及一路获得的见解/理解 。* 本书包括许多增强对其主题理解的额外特徵(并允许读者更多地学习它们) , 如练习题和程式设计项目、有用的网站 , 以及在各章结束处的详尽参考文献列表 。全书一览本书组织成两个部分:图像处理和视频处理 。第1部分(图像处理)从对领域的介绍和概述开始(第1章) , 希望激励学生对其余章节的材料贡献时间和精力 。第2章介绍与图像表达和图像处理操作相关的基本概念、符号和术语 。第3章和第4章分别介绍MATLAB和它的图像处理工具箱 , 并从此开始构建一系列在其末尾以逐步教程为方式介绍实践活动的章(除第5章) 。第5章讨论在图像採集和数位化中涉及的因素 。第6章介绍算术和逻辑操作并介绍感兴趣区域(ROI)的处理 。第7章介绍几何操作 , 如大小调整、旋转、剪下和扭曲 。第8章~第10章致力于基于点(第8章) , 基于直方图(第9章)和基于邻域(第10章)的图像增强技术 。第11章将图像处理操作扩展到频率域并介绍傅立叶变换和相关的频域图像滤波技术 。对图像恢复问题(特别是有噪声和模糊时)的解决在第12章中讨论 。第13章详细介绍了数学形态学和它在图像处理中的套用 。第14章致力于边缘检测技术 。第15章覆盖图像分割 。第16章从灰度图像转到彩色图像 , 介绍有代表性的彩色图像处理技术和算法 。图像压缩和编码 , 包括最现代和相关的标準是第17章的内容 。第18章考察特徵提取和表达问题 , 并自然地引到第19章 , 所得到的特徵矢量在那里可用于分类和识别目的 。第2部分(视频处理)从介绍与模拟视频和系统以及数字视频格式和标準的主要概念和术语开始(第20章) 。它接下来描述在标準之间转换而出现的技术问题(第21章) 。第22章讨论运动估计和补偿技术 , 展示如何可滤波视频序列 , 并用一个使用MATLAB解决在视频序列中目标检测和跟蹤问题的简单例子来结束 。本书包括两个附录 。附录A选择一些在设计图像和视频处理系统中起作用的人类视觉系统特性 。附录B提供一个有关在MATLAB中如何开发图形用户界面(GUI)的教程 。教师注意事项本书可用于一个或两个学期的高年级本科生或研究生入门的图像和视频处理课程 。本书中的大多数材料已经在过去20年里很多这样的课程中检验过 。下面是对採用本教材教师的建议总汇 。第1部分围绕一个典型的机器视觉系统进行组织 , 从图像採集到模式识别 。第1部分中的所有章(除第16章和第17章)遵循一个自然的顺序 , 它覆盖了在图像採集、对它们预处理以消除缺陷或改进它们的性质 , 分割它们为感兴趣的目标 , 提取目标特徵 , 以及将目标划分到不同类型中的所有步骤 。第1章的目标是提供可以用图像处理算法获得的有广度和远景的初步示例 , 以及构成一个机器视觉系统的系统性观点 。有些教师可能希望将这些信息与第2章的材料结合起来作为在该课程早期介绍的主题 。来自第3章和第4章的材料经过细心选择以使本书自成一体 , 它们给学生提供了学习MATLAB和图像处理工具箱教程所有可能会需要的信息 。读者在其后课程中需要与MATLAB相关的帮助还可以参考这两章 。只有有限教学时间的教师可以选择仅仅简短地概述这两章 , 布置对应的教程 , 并通过让学生学习教程并回答相关问题来监控其学习进度 。第5章简洁地介绍图像感知和採集的主题 。它的主要目标是用把一个三维(3-D)真实世界场景转换为一个二维(2-D)数字版本的信息来装备读者 。非常强调图像捕获和採集硬体的课程教师可以用详细的参考文献(如关于在可见光谱外工作的感测器、立体视觉相机、相机校正 , 以及很多其他主题)补充那里的材料 。第6章~第10章很简单明了地涵盖了任何图像处理课程中的基本主题 。它们还为感兴趣的讨论、实验室作业和小的项目提供了很多空间 。第11章对某些学生有点挑战 , 这源自与傅立叶变换相关的数学推导 。教师可以使用那章介绍的MATLAB互动频域演示(fddemo) , 它是一个培养学生对频域滤波技术基本概念的理解信心的有价值工具 。第12章构建在第10章和第11章的知识基础上 , 它聚焦于噪声消除和去模糊技术 。有些教师可以选择淡化对噪声模型(12.1节和12.2节)的讨论 , 而较早地介绍在12.3节~12.5节中描述的空域和频域滤波技术的套用 。第13章自成一体 , 它给了教师调整层次(从完全跳过它到详细介绍它)而不会对课程中其他主题产生重要影响的灵活性 。第14章和第15章介绍了任何图像处理课程中的两个基本主题 。希望在课程里较早介绍其中部分内容或以不同顺序介绍的教师应该可以方便地提取相关的节并将它们移动到不同的时间点 。第16章包含彩色图像处理的信息 , 且以某种形式与先前的章(特别地与那些有关增强、分割和边缘提取的章)相联繫 。保持彩色于一个分离的章中而不是将彩色图像处理分布在文本的各处是一个有意识的决定 。相信当读者接触到第16章时 , 他们将能很容易地浏览其中的内容并将注意力放在他们早期从灰度图像中学到的东西与在彩色图像中对应东西的区别上 。不同意这个观点的教师可以很容易地将第16章的相应节移提前介绍 。第17章考虑图像压缩和编码 , 它们是非常广泛和技术上複杂的主题 , 有些书籍整本都介绍它们 。因为本书关注的是使用MATLAB来构建实用的图像处理和机器视觉解决方案 , 所以将从一个较宽的角度(当今使用的标準、压缩技术的分类和它们的主要特性 , 等等)来考虑而不试图对这些主题进行深入讨论 , 因为那样有可能分散注意力而没有多少意义 。从务实的角度来看 , 因为读者的目标是使用MATLAB来处理图像和利用它从很多格式(大多数使用某种形式的压缩)读取和写入图像的能力 , 所以本书关注的是如何以有意义的方式使用这些能力 。教师可以根据其目标用不同的方式进行 , 从用更多的参考文献扩展第17章(如果图像编码和压缩是课程教学大纲的重要部分)到将整章跳过(如果课程的主要目标是对一个实际问题构建机器视觉方案 , 其中可能不需要这种类型的知识) 。第18章和第19章紧密联繫 。它们提供了设计和实现图像处理和机器视觉方案时最关键阶段中两个方面的信息:特徵提取和模式分类 。依赖于图像的种类和所设计方案的特殊需求 , 第18章给出了特徵提取和表达技术的广泛选择 。教师可能会对第19章为所有学生所提供的从相关模式识别、数据挖掘和信息检索领域需要的基本概念感到满意而不需要另外的参考文献 。如果课程不对任何这些领域有先修的要求 , 这点就尤为重要 。在第19章结尾的教程是根据对第18章和第19章所介绍算法的选择、设计和微调来构建的 。希望在学习到本书的这个位置时 , 学生不仅流畅掌握了MATLAB和图像处理而且获得了回过头来批判地反思什幺可以工作 , 什幺不能工作 , 以及为什幺的能力 。第2部分组织成3章 , 可以用在一个或两个学期(结合图像和视频处理)课程的后段或在专门涉及视频处理课程的前端 。在后一种情况下 , 教师可以用附加的文献(如对研究生层次课程 , 视频处理的学术文章和相关主题)对第2部分的材料进行补充 。第20章涵盖了广泛的主题 , 从基本的模拟视频概念到数字视频标準和编解码器 。它提供了在多个方向扩展的空间 , 从更深入地学习电视广播系统到更详细的分析现代视频压缩框架和标準 。第21章涵盖了标準转换的主题 , 并讨论实现它们的最流行技术 。第22章将讨论扩展到包括运动估计和补偿 , 以及(帧内和帧间)视频滤波技术 。它以一个用MATLAB实现的实用项目结尾 , 该项目是由我从前的一位学生完成的:在一个用固定的相机获得且具有複杂运动背景的视频序列中进行目标检测和跟蹤的系统 。将这个案例研究包括在内的目的是总结第2部分(和全书)的讨论 , 提醒读者在此时他们将应该具有足够的知识以完成类似的项目(教师可在课程结束项目中布置) 。在附录A中的材料与图像和视频处理系统非常相关 , 因为它解释了人类视觉系统特性与其在构建相似系统的设计决策中影响的联繫 。教师也可考虑将它(或部分)在课程的更早阶段介绍 。附录B是一个对开发MATLAB套用GUI的实用指导 。它应该能让学生在它们的MATLAB项目中开发视觉上吸引人、具有互动性和功能性的界面 。还有一个对MATLAB和章末教程的注解 。使用MATLAB(和它的特性处理工具箱)十多年后 , 我完全同意Rudra Pratap [Pra02]所写的话 , “MATLAB的易用性是它的主要特徵” 。MATLAB有一个平缓的学习曲线 , 允许用户加入到一个互动学习的方式中 , 在一定程度上提升用户正确应对挑战的技能 , 并逐步提高 。本书中所包含的MATLAB教程也是在这个理念下构思的 。网站本书配套包含很多为学生和教师準备的补充材料:书中所有MATLAB教程的代码 , 所选图片的MATLAB代码 , 测试图像和视频序列 , 补充问题 , 教程和项目(不能製成印刷版) , 以及一个不断增长和经常维护的网站名单 , 包括图像处理会议、软体、硬体、研究团体、测试图像库以及更多内容(的连结) 。我深深地感谢许多为此项目(直接或间接)合作过的人 。这本书没有他们的帮助是不可能完成的 。我希望感谢许多在图像和视频处理以及相关领域给我以指导的教授、导师和同事 , 特别是Maria G. Te Vaarwerk、Wim Hoeks、Bart de Greef、Eric Persoon、John Bernsen、Borko Furht和Bob Cooper 。特别感谢我的朋友和同事Hugo Vieira Neto , 他在该项目中从早期规划阶段到完成都给予了极大的支持 。我深深感谢Gustavo Benvenutti Borba在创建这本书中大部分图片中的出色工作 , 他有见地的评论和意见、持续的鼓励 , 以及很多小时的时间投入是不能用仅若干行的感谢所回报的 。还要感谢Liam M. Mayron在这个项目所有步骤中的鼓励、支持和专业帮助 。这本书没有Jeremy Jacob的宝贵贡献将不能出版 , 他编写、修订并记录了书和教程中相关的MATLAB代码 , 并贡献了附录B中的内容 。