图像表示与图像处理的基本概念

一、图像及其数字化表示

1.1 人类对光本性认识

光微粒子：牛顿 -> 几何光学 -> 直线传播 --能解释的现象：反射、折射、透射
光波：惠更斯等 -> 波动光学 -> 波长、频率 --能解释的现象：干涉、衍射
光(量)子：爱因斯坦、普朗克 -> 量子光学 -> 能量量子化（不连续） --能解释的现象：光电效应、康普顿散射

1.2 图像的颜色

常用的颜色模型

RGB（红、绿、蓝）-> 主动产生颜色光源（显示器）
CMYK（青、品红、黄、黑） (Cyan, Magenta, Yellow, Black) -> 用于印刷、绘画等
HSI（色调、色饱和度、亮度） (Hue, Saturation, Intensity) ->用于调整颜色分量

1.2.1 R、G、B 三基色

人眼的感受光谱范围约为380~780 nm，原则上可采用各种不同的三色组为标准化，1931年国际照明委员会(CIE)作了统一规定，选定波长700nm、546.1nm和435.8nm的单色光作为红、绿、蓝三原色，又称为物理三基色。任意彩色的颜色方程为：

利用RGB可产生大量的颜色，例如：RGB灰度级分别为256时，可产生224 ≈ 16.8 M 种颜色

颜色空间：描述颜色的三维空间坐标，一个颜色定义为颜色空间的一个点

RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体，在正方体的主对角线上，各原色的量相等，产生由暗到亮的白色，即灰度。（0，0，0）为黑，（1，1，1）为白，正方体的其他6个角点分别为红、黄、绿、青、蓝和品红

1.2.2 颜色模型—CMY模型

CMY为相减混色，它与相加混色的RGB空间正好互补，也即用白色减去RGB空间中的某一色彩值就等于同样色彩在CMY空间中的值

由于彩色墨水和颜料的化学特性，用等量的CMY三基色得到的黑色不是真正的黑色，因此在印刷术中常加一种真正的黑色，所以CMY又写成CMYK

1.2.3 颜色模型—HSI 模型

从人的视觉系统出发，用色调(Hue)、色饱和度( Saturation或Chroma)和亮度(Intensity 或Brightness)来描述色彩

它比RGB色彩空间更符合人的视觉特性

H、S、I 可以分开处理而且相互独立
在HSI色彩空间可以大大简化图像分析和处理的工作量
HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法，因而它们之间存在着转换关系
在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用

I：表示光照强度或称为亮度，它确定了像素的整体亮度，而不管其颜色是什么。其最亮值为1，0为最暗。

H：表示色调，由角度表示(0~360º)。反映了该颜色最接近什么样的光谱波长。0º为红色，120º为绿色，240º为蓝色。

S：表示色饱和度，色饱和度参数是色环的原点到彩色点的半径长度。在环的外围圆周是纯的或称饱和的颜色，其饱和度值为1。在中心是中性（灰）影调，即饱和度为0

1.2.4 颜色模型转换

1.3 图像表示

物理图像—可用连续函数进行较好地描述、分析与处理
数字图像—时空与幅度均为离散的数据矩阵

图像的采样与量化

"分辨率：在一定的面积内取多少个点，或者多少个像素；
"数据深度"：记录每个点的某一因素（亮度/色度）的数据位数。

采样点数越多，图像质量越好。当采样点数减少时，图上的块状效应就逐渐明显。当图像的采样点数一定时，量化级数越多，图像质量越好。量化级数最小的极端情况就是二值图像，图像出现假轮廓。

不同量化级别对图像质量的影响。显然，无论从平面的取点还是记录数据的深度来讲，采样形成的图像与母本必然有一定的差距，丢掉了一些数据。但这个差距如果控制得相当的小，那么这个差距就是可以接受的。

传统图像的描述方式与数据结构

矩阵（matrices）---黑白、灰度、彩色、…… /链表（chains）/拓扑结构（Topological data structures）/ 关系结构（Relational structures） ……

矩阵—黑白图像（二值图像）: 指图像的每个像素只能是黑或者白，没有中间的过渡，故又称为二值图像。2值图像的像素值为0、1。

矩阵—灰度图像:灰度图像像素的灰度级通常为8Bits，即0~255。"0"表示纯黑色,"255"表示纯白色。现实图像的类型基本上可表示为灰度图像，其像素灰度级常用的为8 Bits，但向着10 Bits、12 Bits、16 Bits发展。

矩阵—灰度图像:

矩阵—彩色图像: 通常彩色图像是指每个像素的信息由RGB三原色构成的图像，其中RGB是由不同的灰度级来描述的。

图片格式：https://www.jianshu.com/p/f6bde0058c94

1.4 颜色模型的应用-利用HSI模型特性消除红眼

"红眼"—闪光灯照相的结果:在HSI空间可定义红眼为: -π/4 < 色调<π/4 色饱和度 > 0.3

处理算法

在脸部的特定区域进行色空间转换RGB -> HSI
测试每一点像素
如果：-π/4 < H <π/4 and S>0.3
则该像素为红眼像素，使其成为灰色：S=0

二、数字图像处理

对数字图像处理的定义：

对一个物体的数字表示—二维矩阵—施加一系列的操作，以得到所期望的结果。，常借助于连续函数的分析结果与处理方法进行离散处理，"数字图像处理"不是指"处理数字图像"，而是指"图像的数字处理"

数字图像处理方式：

将一幅图像变为另一幅经过加工的图像，图像到图像的过程
将一幅图像转化为一种非图像的表示，分析、识别与理解的过程

数字图像处理研究的内容

图像变换：改变图像的空间或频谱分布，获取或突出感兴趣信息

空域变换：放大、缩小、旋转……
频域变换：傅立叶变换、离散余弦变换、Walsh变换小波变换……

图像增强和复原

提高图像质量（去除噪声、提高图像的清晰度）
灰度修正、图像平滑、几何校正、图像锐化……

图像的理解和识别

从图像中提取抽象化的特定信息
统计模式分类、句法模式分类……

连续与离散

模拟图像：空间位置的连续性；每个位置上的光强度变化连续性
数字图像:采样(Sample):空间离散化,采样(Sample):空间离散化

图像采样需解决的首要问题：从采样点精确恢复原图像所需要的最小的采样点个数，即各采样点在水平和垂直方向的最大间隔。该问题可看作一维采样定理在二维上的推广。

一维Nyquist采样定理:如果一维信号x(t) 是频带受限信号，其最高频率为fc，当采样频率满足 fs ≥2fc 时，则原信号可由离散样点值精确重建。

二维Nyguist采样定理: 原始图像在水平方向的频率为um，在垂直方向的频率为vm，只要水平方向的空间采样频率u0≥2um，垂直方向的空间采样频率v0≥2vm，即采样点的水平间隔Δx≤(1/2um) ，垂直间隔Δy≤(1/2vm) ，则图像可被精确地恢复。

可见当量化层数 K 加大，则每层长度 L 缩小，总的均方误差也成平方比例缩小，更有利于保持原图的灰度信息。

代数运算

对于两幅输入图像进行点对点的加、减、乘、除计算而得到输出图像。代数运算的一般表达式如下：

（1）加法应用：对同一场景的多幅图像求平均值，达到降低加性随机噪声的影响；将一幅图像的内容叠加到另一幅图像上，达到二次曝光的效果。

（2）减法应用：对同一景物在不同时间的图像或同一景物在不同波段的图像相减（减影技术）。

应用：利用图像间的差异信息，指导动态监测、运动目标检测和跟踪；图像背景消除及目标识别的工作。减影技术在医学上应用广泛。

减法应用：混合图像分离

（3）乘法应用：可用来遮掉图像的某些部分( 掩膜图像)

在掩膜图像中要保留部分的值为1，要被抑制掉的区域则值为零。使用掩膜图像去乘一幅图像，可抹去图像的某部分，即使该不部分为零。

（4）除法应用：除法操作给出的是相应像素值的变化比率，而不是每个像素值的绝对差值，图像相除又称比值处理，是遥感图像处理中常用的方法。

数字图像处理的特点

1、图像信息量大、数据量也大；

在数字图像处理中，一幅图像可看成是由图像矩阵中的像素（pixel）组成的，每个像素的灰度级至少要 6bit（单色图像）来表示，一般采用8bit（彩色图像），高精度的可用12bit 或 16bit。

2、图像处理技术综合性强；

在数字图像处理中涉及的基础知识和专业技术相当广泛。一般来说涉及通信技术、计算机技术、电子技术、电视技术及数学、物理等方面的基础知识。

3、图像信息理论与通信理论密切相关。

早在1948年Shannon发表了"A mathematical Theory of Communication"（通信中的数学理论）一文，它奠定了信息论的基础。此后，信息理论已渗透到了各个领域。图像信息论也属于信息论科学中的一个分支。

图像信息论是在通信理论研究的基础上发展起来的。通信研究的是一维时间信息；图像研究的是二维空间信息。也就是说，图像理论是把通信中的一维问题推广到二维空间上来研究的。

三、图像质量的评价

图像质量评价研究已成为图像信息工程的基础技术之一，当前对图像质量的评估方法主要分成两类

主观评价—通过人眼主观视觉效果进行判断，方法与标准已相对完善

客观评价—通过客观的测量给出量化指标

客观评价-传统客观评价方法

通过计算恢复图像偏离原始图像的误差来衡量恢复图像的质量，最常用的有均方误差(MSE)和峰值信噪比(PSNR)

其中N、M分别是x方向、y方向图像像素点的个数，fij和f'ij分别是原始图像和测试图像在(i, j)点上的取值，L是图像中灰度取值的范围，对8比特的灰度图像而言，L=255。

客观评价-基于视觉感知的测量方法

从视觉心理学角度，视觉是一种积极的感受行为，不仅与生理因素有关，还在相当大的程度上取决于心理因素；人们在观察和理解图像时往往会不自觉地对其中某些区域产生兴趣，这些区域称之为"感兴趣区(ROI)"，整幅图像的视觉质量往往取决于ROI的质量；人们探索各种ROI评价方式。如通过对图像中不同区域的加权突出人眼对ROI的兴趣程度