我的SSE图像优化算法1.图像取反 - 代码天地

我的SSE图像优化算法1.图像取反

业界资讯 2020-07-25 10:31:12 阅读次数: 0

SSE指令一次性能同时处理128位即16个字节型数据，8个short类型的，或者4个int类型数据(128=16×8=8×2×8=4×4×8)
一个字节=8位=255。
取反是对灰度图像取反，所以默认一个像素是一个字节，(如果是彩色24位的图像，24位=3个字节，(5×3+1)×8=128,128位包含5+1/3个像素信息,具体处理办法下篇文章再谈）。SSE代码部分能同时处理16个像素，从上到下，从左到右依次处理，每行余下的不能被16整除的像素则由C++代码进行处理。
以下分别是SSE代码和C++代码：

void IM_Invert_SSE(cv::Mat InImg, cv::Mat& OutImg)
{
	unsigned char *Src= InImg.data;
	unsigned char *Dst = OutImg.data;
	int Width = InImg.cols;
	int Height = InImg.rows;
	const int BlockSize = 16;
	int Block = Width / BlockSize;
	for (int Y = 0; Y < Height; Y++)
	{
		unsigned char *LinePS = Src + Y * Width;
		unsigned char *LinePD = Dst + Y * Width;
		for (int X = 0; X < Block * BlockSize; X += BlockSize, LinePS += BlockSize, LinePD += BlockSize)
		{
			__m128i Src, Result;
			Src = _mm_loadu_si128((__m128i *)(LinePS + 0));
			Result = _mm_andnot_si128(Src, _mm_set1_epi8(255));
			_mm_storeu_si128((__m128i*)(LinePD), Result);
		}
		for (int X = Block * BlockSize; X < Width; X++, LinePS ++, LinePD++)
		{
			LinePD[0] = 255- LinePS[0];
		}
	}
}
void IM_Invert(cv::Mat InImg, cv::Mat& OutImg)
{
	unsigned char *Src = InImg.data;
	unsigned char *Dst = OutImg.data;
	int Width = InImg.cols;
	int Height = InImg.rows;
	const int BlockSize = 16;
	int Block = Width / BlockSize;
	for (int Y = 0; Y < Height; Y++)
	{
		unsigned char *LinePS = Src + Y * Width;
		unsigned char *LinePD = Dst + Y * Width;
		for (int X = 0; X < Width; X++, LinePS++, LinePD++)
		{
			LinePD[0] = 255 - LinePS[0];
		}
	}
}

这里选用犬子2160×2160的照片作为实验图像
原图：
在这里插入图片描述
灰度图这里就不放了（无意打开，有怪莫怪，但愿人没事，奠奠奠）。
灰度图二值化后：

取反后的图：

实验结果：
如图可见在64位debug模式下，SSE优化后，对于2160×2160的图，取反的速度比纯C++代码快了5倍多。

猜你喜欢

转载自blog.csdn.net/weixin_44302212/article/details/107560104

我的SSE图像优化算法1.图像取反

我的SSE图像优化算法2.图像二值化

SSE图像算法优化系列十：简单的一个肤色检测算法的SSE优化。

图像取反

SSE图像算法优化系列十八：三次卷积插值的进一步SSE优化。

SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

SSE图像算法优化系列三十：GIMP中的Noise Reduction算法原理及快速实现。

SSE图像算法优化系列二十三: 基于value-and-criterion structure 系列滤波器（如Kuwahara，MLV，MCV滤波器）的优化。 SSE图像算法优化系列十四：局部均方差及局部平方差算法的优化 SSE图像算法优化系列七：基于SSE实现的极速的矩形核腐蚀和膨胀（最大值和最小值）算法

SSE图像算法优化系列十九：一种局部Gamma校正对比度增强算法及其SSE优化。

超越halcon速度的二值图像的腐蚀和膨胀，实现目前最快的半径相关类算法（附核心源码）。 SSE图像算法优化系列七：基于SSE实现的极速的矩形核腐蚀和膨胀（最大值和最小值）算法 SSE图像算法优化系列十三：超高速BoxBlur算法的实现和优化（Opencv的速度的五倍） SSE图像算法优化系列二十五:二值图像的Euclidean distance map（EDM)特征图计算及其优化

图像像素取反

SSE图像算法优化系列二十二：优化龚元浩博士的曲率滤波算法，达到约500 MPixels/Sec的单次迭代速度 SSE图像算法优化系列四：图像转置的SSE优化（支持8位、24位、32位），提速4-6倍 SSE图像算法优化系列九：灵活运用SIMD指令16倍提升Sobel边缘检测的速度（4000*3000的24位图像时间由480ms降低到30ms）

SSE图像算法优化系列二十：一种快速简单而又有效的低照度图像恢复算法。 SSE图像算法优化系列十五：YUV/XYZ和RGB空间相互转化的极速实现(此后老板不用再担心算法转到其他空间通道的耗时了) SSE图像算法优化系列十九：一种局部Gamma校正对比度增强算法及其SSE优化

图像入门——1. 图像与数字图像介绍

SSE图像算法优化系列二十五:二值图像的Euclidean distance map（EDM)特征图计算及其优化。 SSE图像算法优化系列九：灵活运用SIMD指令16倍提升Sobel边缘检测的速度（4000*3000的24位图像时间由480ms降低到30ms）

图像处理：图像分类算法优化技巧

SSE图像算法优化系列二十六:和时间赛跑之优化高斯金字塔建立的计算过程。

SSE图像算法优化系列二十八：深度优化局部拉普拉斯金字塔滤波器。

1.图像，视频的加载，保存

openCV - 1. 加载、修改、保存图像

图像分类算法优化技巧图像分类算法优化技巧

图像分类算法的优化技巧

图像分类算法优化技巧

SSE图像算法优化系列二十九：基础的拉普拉斯金字塔融合用于改善图像增强中易出现的过增强问题（一）

SSE图像算法优化系列二十一：基于DCT变换图像去噪算法的进一步优化（100W像素30ms）。优化IPOL网站中基于DCT（离散余弦变换）的图像去噪算法（附源代码）

【HTML5 绘图与动画】使用图像 1.导入图像 2.缩放图像 3.裁切图像

暗通道算法优化雾气图像和夜间图像

图像优化

基于OpenCV的车牌识别(1. 车牌图像识别)

OpenCV-Python Tutorials - 2. 1. 图像入门

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)