《机器视觉与算法》学习笔记(一)——图像的采集

    要搭建一套完整的机器视觉设备,图像的采集的硬件选型显然是必不可少的。这一节笔记将从Illumination(照明)、lenses(镜头)、cameras(摄像机)、cameras-computer interface(摄像机与计算机接口)。

一、Illumination(照明,光照)

1.1 光的类型区分

    光是一定波长范围内的电磁辐射。(1)可见光:人眼可见的光,波长在380~780nm;(2)紫外光(UV,ultraviolet):波长在100~380nm;(3)红外线(IR,infrared):波长在780nm~1.5μm;同时比紫外光波长更短的还有x射线和伽马射线,比红外线波长更长的还有微波和无线电波。

1.2 光源类型

常用的光源类型有:

(1)白炽灯:通过细细的灯丝发热产生光;

     优点:相对较亮,而且可以产生色温为3000~4000k的连续光谱;可以工作在低电压;

     缺点:发热严重,只有5%左右的能量转化为光,能量损失较大;寿命短,而且不能作为闪光灯;

色温:色温是表示光线中包含颜色成分的一个计量单位。从理论上讲,色温是指绝对黑体从绝对零度(-273)开始加温后呈现的颜色。黑体受热后,逐渐由黑变红,转黄,发白,最后发出蓝色光。加热到一定的温度,黑体发出的光所含的光谱成分,就称为这一温度下的色温,计量单位为“K”(开尔文)。如果某一光源发出的额光,与某一温度下黑体发出的光所含的光谱成分相同,即称为某K色温、如100W灯泡发出的光的颜色,与绝对黑体在2527k是的颜色相同,那么灯泡发出的光的色温就是:2527K+273K=2800K。

(2)氙灯:是在密闭的玻璃灯泡中充入氙气,氙气被电离后产生的色温在5500~12000K的非常亮的白光。常分为:连续发光的短弧灯,长弧灯,以及闪光灯。

     优点:做成的闪光灯的每次亮的时间可以短至1~20微秒;

     缺点:供电复杂且昂贵,几百万次闪光后易老化。

(3)荧光灯:也是一类气体放电光源,通过电流激发在氩、氖等惰性气体环境中的水银蒸汽,产生紫外光辐射。

     优点:使用不同的涂层,可以产生3000~6000K的色温可见光;价格便宜,照明面积大;

     缺点:寿命短,老化快,光谱分布不均匀,在有些频率下有尖峰,而且不能做闪光灯;由交流电供电,会产生和交流电一样频率的闪烁。

(4)发光二极管(LED灯):一种通过电致发光的半导体,能产生类似的单色光的非常窄的光谱的光。目前,机器视觉最常见的一种。

     优点:寿命长,功耗小,发热小,可做为闪光灯,响应速度快;由于LED灯采用直流供电,亮度控制十分容易;

     缺点:LED的性能与环境温度有关,环境温度越高,LED性能越差,寿命越短。

1.3 使用光源的一些注意:

(1)光与被测物体之间的相互作用:当光源照射到被测物体上时,由于被测物体本身的粗糙程度不同,会发生镜面反射,漫反射,偏振光等物理反应。当设计机器视觉图像采集设备时,为了更好的得到彩图图像,需要将这些因素考虑进来。

(2)利用光的光谱特性:利用不同元件对于不同颜色的彩色光吸收程度不同,采用不同的色光的光源,更有利于增强我们需要的特征。

(3)利用光照的方向性:采用不同的光照方向可以得到不同的效果。

二、Lenses(镜头)

    镜头是一种光学设备,用于聚集光线在摄像机内部成像。镜头的作用是产生锐利的图像,以得到被测图像的细节。从而便于在后面的图像处理中获得更显著的特征,进而更好的完成工程目的。

对于镜头这一块,有几个概念需要理解一下:

2.1 针孔摄像机

    首先,是针孔相机的一个成像原理。像平面相当于一个方盒子的一个面,在这个面的对面是针孔所在的面,针孔相当于投影的中心,针孔摄像机所成的像为物体的倒像。也就是我们初中学习的小孔成像的原理。


2.2 高斯光学

    由于针孔太小,只有极少量的光线能够通过小孔到达像平面,因此必须采用非常长的曝光时间以得到亮度足够的图像。因此真正的摄像机使用镜头收集光线。镜头通常由一定形状的玻璃或塑料构成。玻璃和塑料的形状决定了镜头可能使光线发散或汇聚。但是,我们知道像玻璃或者塑料,当光线透过时会产生折射现象,而折射是一个非线性过程。所以,镜头的成像也是非线性过程。也就是说,同心光束通过镜头后将不能完全汇聚在一点。

    而高斯光学,是高斯在1841年建立的研究理想光学系统的几何光学理论,是几何光学的分支又称近轴光学,它适用于任何结构的光学系统,但所研究的光线必须满足近轴条件。为什么需要满足近轴条件呢?

    吐尔逊·买买提在他的论文:几何光学中引入“近轴条件”概念的物理意义中写的很仔细。文中给出的答案是:为了满足光的单心性。文中证明了当α很小时,同一个物点所发出的不同光线经球面反射后会交于一点。光束的单心性得以保持。一个物体将有一个确定像点与之对应。如果物点在垂轴平面上移动时,其完善像点也在垂轴平面上作线性移动,则此光学系统成像是理想的。可以证明,非常靠近光轴的细小物体,其每个物点都以很细的、 很靠近光轴的单色光束被光学系统成像时,像是完善的。这表明,任何实际的光学系统(包括单个球面、单个透镜)的近轴区都具有理想成像的性质。

    因此,光学系统的设计是为了使镜头的结构在满足高斯光学的基础上使入射角足够大,以满足实际应用。其中,满足高斯光学是为了被拍摄物体更好的成像,入射角越大是为了是足够的光线进入像平面,以减少曝光时间。

2.3 景深

 对于景深引用百度百科上的解释:

景深(DOF,depth of field),是指在摄影机镜头或其他成像器前沿能够取得清晰图像的成像所测定的被摄物体前后距离范围。而光圈、镜头、及拍摄物的距离是影响景深的重要因素。
在聚焦完成后,焦点前后的范围内所呈现的清晰图像,这一前一后的距离范围,便叫做景深。在镜头前方(调焦点的前、后)有一段一定长度的空间,当被摄物体位于这段空间内时,其在底片上的成像恰位于焦点前后这两个弥散圆之间。被摄体所在的这段空间的长度,就叫景深。换言之,在这段空间内的被摄体,其呈现在底片面的影象模糊度,都在容许弥散圆的限定范围内,这段空间的长度就是景深。

                         

2.4 镜头的像差

    像差(全称色像差, aberration)是指实际光学系统中,由非近轴光线追迹所得的结果和近轴光线追迹所得的结果不一致,与高斯光学(一级近似理论或近轴光线)的理想状况的偏差。像差主要分为球差、彗差、场曲、像散、畸变、色差以及波像差。

    像差 一般分两大类:色像差和单色像差。色像差简称色差,是由于透镜材料的折射率是波长的函数,由此而产生的像差。它可分为位置色差和放大率色差两种。单色像差是指即使在高度单色光时也会产生的像差,按产生的效果,又分成使像模糊和使像变形两类。前一类有球面像差、彗形像差和像散。后一类有像场弯曲和畸变。

三、cameras(摄像机)

    摄像机的话市面上主要有两种类型:CCD和CMOS类型的相机。其中,又以CCD传感器制成的相机居多。一下是CCD和CMOS传感器的区别:

CCD与CMOS传感器是当前被普遍采用的两种图像传感器,两者都是利用感光二极管(photodiode)进行光电转换,将图像转换为数字数据,而其主要差异是数字数据传送的方式不同。

    如下图所示,CCD传感器中每一行中每一个象素的电荷数据都会依次传送到下一个象素中,由最底端部分输出,再经由传感器边缘的放大器进行放大输出;而在CMOS传感器中,每个象素都会邻接一个放大器及A/D转换电路,用类似内存电路的方式将数据输出。

       

                左图为CCD传感器的结构,右图为CMOS传感器的结构

造成这种差异的原因在于:CCD的特殊工艺可保证数据在传送时不会失真,因此各个象素的数据可汇聚至边缘再进行放大处理;而CMOS工艺的数据在传送距离较长时会产生噪声,因此,必须先放大,再整合各个象素的数据。
由于数据传送方式不同,因此CCD与CMOS传感器在效能与应用上也有诸多差异,这些差异包括:
  1. 灵敏度差异:由于CMOS传感器的每个象素由四个晶体管与一个感光二极管构成(含放大器与A/D转换电路),使得每个象素的感光区域远小于象素本身的表面积,因此在象素尺寸相同的情况下,CMOS传感器的灵敏度要低于CCD传感器。
  2. 成本差异:由于CMOS传感器采用一般半导体电路最常用的CMOS工艺,可以轻易地将周边电路(如AGC、CDS、Timing generator、或DSP等)集成到传感器芯片中,因此可以节省外围芯片的成本;除此之外,由于CCD采用电荷传递的方式传送数据,只要其中有一个象素不能运行,就会导致一整排的数据不能传送,因此控制CCD传感器的成品率比CMOS传感器困难许多,即使有经验的厂商也很难在产品问世的半年内突破 50%的水平,因此,CCD传感器的成本会高于CMOS传感器。
  3. 分辨率差异:如上所述,CMOS传感器的每个象素都比CCD传感器复杂,其象素尺寸很难达到CCD传感器的水平,因此,当我们比较相同尺寸的CCD与CMOS传感器时,CCD传感器的分辨率通常会优于CMOS传感器的水平。例如,目前市面上CMOS传感器最高可达到210万象素的水平(OmniVision的 OV2610,2002年6月推出),其尺寸为1/2英寸,象素尺寸为4.25μm,但Sony在2002年12月推出了ICX452,其尺寸与 OV2610相差不多(1/1.8英寸),但分辨率却能高达513万象素,象素尺寸也只有2.78mm的水平。
  4. 噪声差异:由于CMOS传感器的每个感光二极管都需搭配一个放大器,而放大器属于模拟电路,很难让每个放大器所得到的结果保持一致,因此与只有一个放大器放在芯片边缘的CCD传感器相比,CMOS传感器的噪声就会增加很多,影响图像品质。
  5. 功耗差异:CMOS传感器的图像采集方式为主动式,感光二极管所产生的电荷会直接由晶体管放大输出,但CCD传感器为被动式采集,需外加电压让每个象素中的电荷移动,而此外加电压通常需要达到12~18V;因此,CCD传感器除了在电源管理电路设计上的难度更高之外(需外加 power IC),高驱动电压更使其功耗远高于CMOS传感器的水平。举例来说,OmniVision近期推出的OV7640(1/4英寸、VGA),在 30 fps的速度下运行,功耗仅为40mW;而致力于低功耗CCD传感器的Sanyo公司去年推出了1/7英寸、CIF等级的产品,其功耗却仍保持在90mW 以上,虽然该公司近期将推出35mW的新产品,但仍与CMOS传感器存在差距,且仍处于样品阶段。
  综上所述,CCD传感器在灵敏度、分辨率、噪声控制等方面都优于CMOS传感器,而CMOS传感器则具有低成本、低功耗、以及高整合度的特点。不过,随着CCD与CMOS传感器技术的进步,两者的差异有逐渐缩小的态势,例如,CCD传感器一直在功耗上作改进,以应用于移动通信市场(这方面的代表业者为Sanyo);CMOS传感器则在改善分辨率与灵敏度方面的不足,以应用于更高端的图像产品,我们可以从以下各主要厂商的产品规划来看出一些端倪。

四、cameras-computer interface(摄像机与计算机接口)

摄像机采集图像主要有两种模式,同步采集和异步采集。捕获图像后输出模拟或者数字视频信号:

(1)模拟视视频信号,需要在计算机中安装一块图像采集卡的专用接口卡。对于机器视觉来讲,其中四中比较重要:
EIA-170和CCIR。这是黑白的视频标准;EIA-170和NTSC的帧率为30Hz,每幅图像有525行;
PAL和NTSC。这是彩色视频的标准;CCIR和PAL帧率为25Hz,每幅图像有625行。

    (2)数字视频信号。模拟视频信号的同步信息是包含在信号中的,与其相反,数字视频的同步信息是分离的。为了生存数字信号,摄像机会将传感器输出的电压进行数模转换,然后将产生的数值串行或并行地传输到图像采集卡。

  • Camera Link :Camera Link 标准规范了数字摄像机和图像采集卡之间的接口,采用了统一的物理接插件和线缆定义。只要是符合Camera Link 标准的摄像机和图像卡就可以物理上互联。Camera Link 标准中包含Base,Medium,Full 三个规范,但都使用统一的线缆和接插件。Camera Link Base 使用4 个数据通道,Medium 使用了8 个数据通道,Full 使用12 个数据通道。Camera Link 标准支持的最高数据传输率可达680MB/s。 Camera Link 标准中还提供了一个双向的串行通讯连接。图像卡和摄像机可以通过它进行通信,用户可以通过从图像卡发送相应的控制指令来完成摄像机的硬件参数设置和更改,方便用户以直接编程的方式控制摄像机。从Camera Link 标准推出之日起,各个图像卡生产商就积极支持该标准,因此,LVDS 和Channel Link 接口的硬件已经淡出了市场。如果用户需要开发一个新的高性能机器视觉系统,无论是选择摄像机还是图像卡时,都应该优先考虑采用Camera Link 接口的产品。
  • IEEE 1394:IEEE1394接口是苹果公司开发的串行标准,俗称火线接口(firewire)。同USB一样,IEEE1394也支持外设热插拔,可为外设提供电源,省去了外设自带的电源,能连接多个不同设备,支持同步数据传输。IEEE1394分为两种传输方式:Backplane模式和Cable模式。Backplane模式最小的速率也比USB1.1最高速率高,分别为12.5 Mbps 、25 Mbps、50 Mbps,可以用于多数的高带宽应用。Cable模式是速度非常快的模式,分为100 Mbps、200 Mbps和400 Mbps几种,在200Mbps下可以传输不经压缩的高质量数据电影。 1394b 是 1394技术的升级版本,是仅有的专门针对多媒体--视频、音频、控制及计算机而设计的家庭网络标准。它通过低成本、安全的 CAT5 (五类)实现了高性能家庭网络。1394a自1995年就开始提供产品,1394b 是1394a 技术的向下兼容性扩展。1394b能提供800 Mbps或更高的传输速度,虽然市面上还没有1394b接口的光储产品出现,但相信在不久之后也必然会出现在用户眼前。
  • IEEE1394连接线相比于USB接口,早期在USB1.1时代,1394a接口在速度上占据了很大的优势,在USB2.0推出后,1394a接口在速度上的优势不再那么明显。同时绝对多数主流的计算机并没有配置1394接口,要使用必须要购买相关的接口卡,增加额外的开支。单纯1394接口的外置式光储基本很少,大多都是同时带有1394和USB接口的多接口产品,使用更为灵活方便。IEEE 1394的原来设计,系以其高速传输率,容许用户在电脑上直接透过 IEEE 1394 介面来编辑电子影像档案,以节省硬碟空间。在未有 IEEE 1394 以前,编辑电子影像必须利用特殊硬件,把影片下载到硬碟上进行编辑。但随着硬碟空间愈来愈便宜,高速的IEEE 1394 反而取代了 USB 2.0 成为了外接电脑硬碟的最佳接口。1394A所能支持理论上最长的线长度为4.5米,标准正常传输速率为100Mbps,并且支持多达63个设备。
  • USB2.0:USB(Universal Serial Bus2.0,通用串行总线)是一种应用在计算机领域的新型接口技术。USB接口具有传输速度更快,支持热插拔以及连接多个设备的特点。目前已经在各类外部设备中广泛的被采用。USB接口有三种:USB1.1,USB2.0和USB3.0。理论上USB1.1的传输速度可以达到12Mbps,而USB2.0则可以达到速度480Mbps,并且可以向下兼容USB1.1。早在1995年,就已经有个人电脑带有USB接口了,但由于缺乏软件及硬件设备的支持,这些个人电脑的USB接口都闲置未用。1998年后,随着微软在Windows 98中内置了对USB接口的支持模块,加上USB设备的日渐增多,USB接口才逐步走进了实用阶段。这几年,随着大量支持USB的个人电脑的普及,USB逐步成为个人电脑的标准接口已经是大势所趋。在主机端,最新推出的个人电脑几乎100%支持USB;而在外设端,使用USB接口的设备也与日俱增,例如数码相机、扫描仪、游戏杆、磁带和软驱、图像设备、打印机、键盘、鼠标等等。
  • Gigabit Ethernet (千兆网):吉比特以太网或称千兆以太网,(GbE, Gigabit Ethernet或 1 GigE) 是一个描述各种以吉比特每秒速率进行以太网帧传输技术的术语,由IEEE 802.3-2005标准定义。该标准允许通过集线器连接的半双工吉比特连接,但是在市场上利用交换机的全双工连接才是标准。

猜你喜欢

转载自blog.csdn.net/zhu_hongji/article/details/80884610