OpenCV学习 之 IplImage*遍历每个像素点

IplImage是OpenCV中CxCore部分基础的数据结构,用来表示图像。IplImage结构体如下所示:

 typedef struct _IplImage  
    {  
         int  nSize;         /* IplImage大小 */  
         int  ID;            /* 版本 (=0)*/  
         int  nChannels;     /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */  
         int  alphaChannel;  /* 被OpenCV忽略 */  
         int  depth;         /* 像素的位深度: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U, 
                                IPL_DEPTH_16S, IPL_DEPTH_32S, IPL_DEPTH_32F and IPL_DEPTH_64F 可支持 */  
         char colorModel[4]; /* 被OpenCV忽略 */  
         char channelSeq[4]; /* 同上 */  
         int  dataOrder;     /* 0 - 交叉存取颜色通道, 1 - 分开的颜色通道. 
                                cvCreateImage只能创建交叉存取图像 */  
         int  origin;        /* 0 - 顶—左结构, 
                                1 - 底—左结构 (Windows bitmaps 风格) */  
         int  align;         /* 图像行排列 (4 or 8). OpenCV 忽略它,使用 widthStep 代替 */  
         int  width;         /* 图像宽像素数 */  
         int  height;        /* 图像高像素数*/  
         struct _IplROI *roi;/* 图像感兴趣区域. 当该值非空只对该区域进行处理 */  
         struct _IplImage *maskROI; /* 在 OpenCV中必须置NULL */  
         void  *imageId;     /* 同上*/  
         struct _IplTileInfo *tileInfo; /*同上*/  
         int  imageSize;     /* 图像数据大小(在交叉存取格式下imageSize=image->height*image->widthStep),单位字节*/  
         char *imageData;  /* 指向排列的图像数据 */  
         int  widthStep;   /* 排列的图像行大小,以字节为单位 */  
         int  BorderMode[4]; /* 边际结束模式, 被OpenCV忽略 */  
         int  BorderConst[4]; /* 同上 */  
        char *imageDataOrigin; /* 指针指向一个不同的图像数据结构(不是必须排列的),是为了纠正图像内存分配准备的 */  
     }  
     IplImage;  

对我们来说比较重要的两个元素是:char *imageData以及widthStep

imageData指向"存储图像数据的一块数据区”、“排列的图像行大小”。 我们都知道,一张图是由无数个像素点构成的,每个像素点的像素值都不同所以我们看到的图片才具有丰富的颜色。 imageData就是一个指针,指向某张图片像素值数据的首地址。 如:(uchar )frameimg->imageData就是图像第一行首地址。
widthStep表示存储一行像素需要的字节数。因为opencv分配的内存是按4字节对齐的,所以widthStep必须是4的倍数,如果8U图像宽度为3,那么widthStep是4,加一个字节补齐。这个图像的一行需要4个字节,只使用前3个,最后一个空在那儿不用。也就是一个宽3高3的图像的imageData数据大小为4
3=12字节。

使用指针遍历图像像素:
1、单通道字节型图像像素访问:

#include <cv.h>  
#include <highgui.h>  
 using namespace std;
using namespace cv;
int main(void)
{
IplImage* imgSrc = cvLoadImage("./inputData\\shuke1.jpg",0);
uchar* pixel = new uchar;
for (int i = 0; i < imgSrc->height; i++)  //遍历每一行
{
for (int j = 0; j < imgSrc->width; j++) //遍历每一列
{
pixel = (uchar*)(imgSrc->imageData + i*imgSrc->widthStep+j);
cout << "pixel=" <<(*pixel)+0<< endl;//+0隐式转换为整型,否则会打印出字符
}
}
delete pixel;
     return 0;
 }

输出结果是0-255灰度级的灰度值。
其中(uchar*)(imgSrc->imageData + iimgSrc->widthStep+j)的具体含义
(1)一个m
n的单通道字节型图像,其imageData排列如下:
在这里插入图片描述
(2)imgSrc->imageData指向图像第一行的首地址,i是指当前像素点所在的行,widthStep是指图像每行所占的字节数;所以imgSrc->imageData + iimgSrc->widthStep表示该像素点所在行的首地址;j表示当前像素点所在列,所以imgSrc->imageData + iimgSrc->widthStep+j即表示该像素点的地址。而因为IplImage->ImageData 的默认类型是 char 类型,所以再对图像像素值进行操作时,要使用强制类型转换为unsigned char,再对其进行处理。否则,图像像素值中,会有负值出现。

2、三通道字节型图像像素访问

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);
uchar* data=(uchar *)img->imageData;
int step = img->widthStep/sizeof(uchar);   //因为是三通道,所以要做一下这个操作
int channels = img->nChannels;             //这个图片为3通道的
uchar *b,*g,*r;
for(int i=0;iheight;i++)
     for(int j=0;jwidth;j++){
           *b=data[i*step+j*chanels+0];    //此时可以通过更改bgr的值达到访问效果。
           *g=data[i*step+j*chanels+1];
           *r=data[i*step+j*chanels+2];
      }

注意:
int step = img->widthStep/sizeof(uchar);
b=data[istep+jchanels+0];
(1)多通道字节型图像的imageData排列如下:
在这里插入图片描述
其中(Bi,Bj)(Gi,Gj)(Ri,Rj)表示图像(i,j)处BGR分量的值。
(3)注意三通道和一通道的最主要区别就是:三通道并没有直接用widthStep,而是用了int step = img->widthStep/sizeof(uchar)中的step,但是实际上sizeof(uchar)=1。通道数为3。
i
step 当i=0 即为上图的第一行 为1就是第二行
jchanels+0 j通道数 当j=0为第一列的第0个通道->b,其实是第一个元素的B的值
jchanels+1 j通道数 当j=0为第一列的第1个通道->g ,其实是第一个元素的G的值
jchanels+2 j通道数 当j=0为第一列的第2个通道->r ,其实是第一个元素的R的值
jchannels+0 当j=1,1X3+0=3,也就是第二列的第0个通道->b,其实是第二个元素的B的值
j
channels+1 当j=1,1X3+1=4,为第二列的第1个通道->g,其实是第二个元素的G的值

PS:
1、区分widthStep和width:
学习OpenCV过程中,使用IPLImage结构,调用数据时定位数据区别widthStep和width:
(1)width表示图像的象素个数,也就是图像的水平长度
(2)widthStep是保存的数组长度,等于widthChannes(通道数),比如对BGR图像,有三通道widthStep=width3;灰度图只有一个通道widthStep=width。

2、浮点型图像和字节型图像:
首先通道指的是图层,咱们一般的图像是3通道的,就是R G B三个图层的图像,将3个图层叠在一起就是一副图像了,单通道图像就是灰度图,说白了就是黑白图片。所谓的单字节,浮点这些指的是存放图像矩阵的数据类型,有char型(单字节)float(浮点型),其中矩阵中的每一个元素表示一个像素点,所以说类型的位数越多,表示的色彩就越多,好像单字节只能表示255中颜色,而float型能表示32位色,就是2的32次方减一中颜色。
图像有若干通道,灰度图有一个通道,彩色图像通常有红、绿、蓝三个构成成分(OpenCV 以蓝、绿、红来存储这三个分量)。每个像素使用若干位来存储,称之为图像深度(image depth)。对于灰度图像,每个像素通常存储为8位,因此允许256个(0~255)个灰度级。对于彩色图像,每个像素存储为3个字节,每个颜色通道占一个字节。

参考:
https://www.cnblogs.com/codingmengmeng/p/6559724.html
http://blog.sina.com.cn/s/blog_b4ce638e0101dlda.html
http://www.cnblogs.com/yuaisunmin/p/3154063.html
https://blog.csdn.net/qikaibinglan/article/details/6200751
https://blog.csdn.net/icurious/article/details/58585610
https://zhidao.baidu.com/question/556694564.html

猜你喜欢

转载自blog.csdn.net/weixin_43384257/article/details/88381646