数字图像处理:一、基础知识

 一、成像基础

广义来说,我们肉眼所看到的世界都是图像。 “图”是物体透射或者反射的光信息,或者说,“图”是电磁波承载的能量在景物上的分布;“像”是光信息被人的视觉系统接收后在人的大脑中所形成的印象或者认知。“图像”就是客观存在的二维、三维灰度或者彩色的“图”在认知感觉中所产生的“像”,它是客观和主观相结合的产物。

视觉过程既是光学过程,又是化学过程,更是神经处理过程。

1.光学过程:即遵循小也成像原理,影像在视网膜形成的过程。

2.化学过程:视觉的化学过程‌主要涉及视网膜上的感光细胞对光信号的转换。

视网膜中包含视锥细胞(cones)、视杆细胞(rod)。

视锥细胞可以感知色彩,对红、绿、蓝光最敏感,视杆细胞仅能分辨明暗不能感知色彩。

视杆细胞比视锥细胞数量多,因此人眼对亮度比对色彩更敏感,弱光环境下仅视杆细胞起作用,视觉系统无法在暗环境中辨别色彩,视锥细胞有三种,分别对波长在570 nm红光、 波长535 nm绿光、 波长445 nm蓝光最敏感。

三种视锥细胞有部分重叠的频率响应曲线,但响应强度有所不同,它们共同决定了色彩感觉 视觉系统对相同强度、不同波长的光敏感度不同,其中对绿光最敏感,对蓝光最不敏感。

视网膜上的感光细胞还涉及到一种称为视紫红质的化学物质。视紫红质在光的作用下会发生构象变化,这种变化是视觉感知的基础‌。当光线照射到视网膜上时,视紫红质分子吸收光子并发生构象变化,导致神经信号的产生和传递‌。

3.神经处理过程:

神经处理过程是一个在大脑神经系统里进行的转换过程。每个视网膜接收单元都与一个神经元细胞借助突触(synapse)相连。每个神经元细胞借助其他的突触再与其他细胞连接,从而构成光神经(optical nerve)网络。光神经进一步与大脑中的侧区域(sideregion of the brain)连接,并到达大脑中的纹状皮层(striated cortex)。在那里,对光刺激产生的响应经过一系列处理最终形成关于场景的表象,从而将对光的感觉转化为对景物的知觉。

4.电磁波谱与可见光

实际场景在适当光源照射下产生反射光波或者物体本身发射电磁波。

传感器接收到反射光波或物体本身发射的电磁波,并将接收到的信号数字化后输出给图像处理设备。

图像处理设备指配置适当软件、硬件的处理设备,该设备可根据指定用途将图像显示、存储或者经后期算法处理达到特定目的。

无线电波波段成像主要用于医学和天文学。微波是频率在300 MHz~300 GHz,用于天文观测、生物组织成像、遥感等,自动驾驶中所用的雷达波成像就是微波成像。

红外波成像无需外部光或热源就可获得完整的热排放量被动影像,用于天文、夜间辅助驾驶、安防监控、交通监控、军事设备全天候全视系统、遥感、生物检测、地质勘探。

光波段图像是最常见的,无需处理人眼就可直接看到彩色图像,这一波段的成像应用领域之广远超其它波段,广泛应用于遥感、天文、工业检测、娱乐等各个方面。

二、数字图像

1.图像数字化

视觉系统看到的图像是模拟的,模拟包括空间的模拟性和色彩模拟性。

数字图像对空间坐标离散化(采样)、对图像值离散化(量化),获得二维函数即数字图像f(x, y),其中x和y是数字化的二维空间坐标,f(x, y)为该坐标位置上数字化的图像取值。

数字图像是有限空间、精度有限的一组数值的集合,每个空间坐标对应的图像值为一个像素。

2.数字图像传感器

2 图像传感器

完成图像数字化的传感器主要包括以下类型: ‌

1)CCD传感器(电荷耦合器件)‌

通过电荷耦合实现光电信号转换,具有高分辨率和高成像质量,长期主导高端成像领域‌。

典型应用:专业摄影、天文观测等对画质要求较高的场景‌。 ‌

2)CMOS传感器(互补金属氧化物半导体)‌

基于半导体工艺,集成度高、功耗低且成本优势显著,目前占据主流市场‌。

细分类型: ‌

        被动式像素传感器(PPS)‌:早期技术,性能有限‌。 ‌

        主动式像素传感器(APS)‌:性能优化,支持快速读取和高分辨率‌。

         典型应用:智能手机、安防监控、消费级相机等‌。

3)其他类型‌ ‌

CIS传感器(接触式图像传感器)‌ 采用LED光源,需近距离接触扫描,多用于扫描仪‌。 ‌

EMCCD传感器(电子倍增CCD)‌ 通过电子倍增技术增强弱光信号,适用于低光照环境‌。 ‌

InGaAs传感器‌ 基于铟镓砷材料,专用于近红外光谱成像‌。

BSI传感器(背照式传感器)‌ 通过背照式结构提升感光效率,改善低光性能‌。 ‌

TOF传感器(飞行时间传感器)‌ 通过测量光线飞行时间实现3D深度感知‌。 ‌

HDR传感器(高动态范围传感器)‌ 支持宽动态范围,适用于高对比度场景‌。 ‌

特殊类型传感器‌ 包括 ‌JFET LBCAST‌(高速响应)、‌Foveon X3‌(多层色彩捕获)、‌Live MOS‌(低噪设计)等,用于特定专业设备‌5。 ‌技术趋势‌ CMOS传感器因背照式技术(BSI)、堆叠式设计等创新,持续向高分辨率、高速读取方向演进‌。

3D-ToF传感器在自动驾驶、AR/VR等领域加速普及‌。

三、数字图像处理基础

1.数字图像处理系统的组成

传感器接收到反射光波或物体本身发射的电磁波,并将接收到的信号数字化后输出给图像处理设备。 图像处理设备指配置适当软件、硬件的处理设备,该设备可根据指定用途将图像显示、存储或者经后期算法处理达到特定目的。

2.数字图像处理软件环境配置

PyCharm的安装与界面

Download PyCharm: The Python IDE for data science and web development by JetBrains  https://www.jetbrains.com/pycharm/download/?section=windows

PyCharm 界面如下,用到的主要是以下5个区域。

菜单栏:新建,设置都在这里。

Run 和 Debug:用于运行,Run 直接启动,Debug 启动可以加断点调试。

项目的目录:项目相关的文件在这里找。

编辑区域:写代码的地方。

终端区:TODO 记录要做的事;Terminal 是程序输出的地方;Python Console 是控制台,可以直接运行 Python 语句,就像在 cmd 里输入 python 后的效果。

集成开发环境(IDE Integrated Development Environment)----集成了开发软件所需的所有的工具。