数字水印 | 离散余弦变换 DCT 基本原理及 Python 代码实现

企业开发 2024-11-04 18:36:06 阅读次数: 0

1 基本原理

参考博客：https://www.cnblogs.com/zxporz/p/16072580.html

$\mathsf{DCT}$ 全称为 $\mathsf{Discrete\ Cosine\ Transform}$ ，即离散余弦变换。 $\mathsf{DCT}$ 变换属于傅里叶变换的一种，常用于对信号和图像（包括图片和视频）进行数据压缩。 $\mathsf{DCT}$ 是视频压缩史上最重要的发明之一，对于 $\mathsf{H.26X}$ 和 $\mathsf{JPEG}$ 等压缩标准的制定至关重要。

虽然 $\mathsf{DCT}$ 具有比较复杂的数学公式，但是我们这里仅做简单理解。

对一幅图像执行离散余弦变换 $\mathsf{(DCT)}$ 相当于将图像的能量集中在变换系数的左上角，这部分系数被称为直流 $\mathsf{(DC)}$ 系数。直流系数是 $\mathsf{DCT}$ 最重要的输出之一，因为它携带了原始图像的大部分信息。其余的系数，分布在左上角之外的区域，被称为交流 $\mathsf{(AC)}$ 系数。这些系数包含了图像的细节信息，反映了图像的纹理和边缘。

只要对这些 $\mathsf{DCT}$ 系数做逆离散余弦变换 $\mathsf{(IDCT)}$ ，理论上就可以重建出原始图像的像素矩阵。需要注意的是， $\mathsf{DCT}$ 本身并不直接压缩数据。它起到的是一个准备作用，为后续的量化、编码等压缩步骤提供了有力的数学基础。量化过程会根据需要压缩的强度，减少 $\mathsf{AC}$ 系数中的某些值，从而实现数据压缩。

假设一张图片由 $3\times3$ 个像素块构成，如下图所示：

原文说的是，取一个图像中的一部分，且这个部分只包含 $3\times3$ 个像素。

如上图所示，相当于是把其余格的部分信息（特征）都抽取到了第一个格。第一个格的像素值就是这个图像的低频信息，其余格的就是这个图像的高频信息。低频信息主要表示的是一张图的总体样貌，一般低频系数的值也比较大。而高频信息主要表示的是图像中人物或物体的细节，一般高频系数的数量较多。做完 $\mathsf{DCT}$ 变换后，低频信息和高频信息就分离开来了。

2 代码实现

参考博客：https://blog.csdn.net/qq_41821067/article/details/114113677

import cv2
import numpy as np
from matplotlib import pyplot as plt


# 处理原始图像
img = cv2.imread('logo.jpg', 0)  # 读取图像为灰度图像
print("img.shape:", img.shape)
img1 = img.astype('float32')  # 将unit8类型转换为float类型

# 进行离散余弦变换
img_dct = cv2.dct(img1)
print("img_dct:", img_dct)
print("img_dct.shape:", img_dct.shape)

# 进行对数处理
img_dct_log = np.log(abs(img_dct))
print("img_dct_log:", img_dct_log)

# 进行逆离散余弦变换
img_recor = cv2.idct(img_dct)
print("img_recor:", img_recor)
print("img_recor.shape:", img_recor.shape)

# 判断是否相同
print("img:", img)
print("img_recor:", img_recor)
print(abs(img - img_recor) < 1)

# 画图
plt.subplot(1, 4, 1)
plt.title("Original Image", fontsize=12, loc="center")
plt.axis('off')
plt.imshow(img, cmap="gray")

plt.subplot(1, 4, 2)
plt.title("Coefficients", fontsize=12, loc="center")
plt.axis('off')
plt.imshow(img_dct, cmap="gray")

plt.subplot(1, 4, 3)
plt.title("Log", fontsize=12, loc="center")
plt.axis('off')
plt.imshow(img_dct_log, cmap="gray")

plt.subplot(1, 4, 4)
plt.title("Recovered Image", fontsize=12, loc="center")
plt.axis('off')
plt.imshow(img_recor, cmap="gray")

plt.savefig('test.jpg', dpi=400, bbox_inches='tight')
plt.show()

代码说明：

根据 img.shape 和 img_dct.shape 的结果可知 $\mathsf{DCT}$ 并不会改变图像的大小。
根据 img_dct 可知 $\mathsf{DCT}$ 系数非常小，以至于在视觉上难以区分。为了更好地可视化这些系数，我们对其进行对数变换，以拉伸坐标轴的刻度，使得小的系数在图像中也能显示出来。
根据 img 和 img_recor 可知原始图像和还原后的图像并不完全相等，但是根据 print(abs(img - img_recor) < 1) 可知二者之间的像素差值不会超过 $1$ 。

效果如下：

在这里插入图片描述

3 图像压缩

import cv2
from matplotlib import pyplot as plt


# 处理原始图像
img = cv2.imread('logo.jpg', 0)  # 读取图像为灰度图像
img1 = img.astype('float32')  # 将unit8类型转换为float类型

# 进行离散余弦变换
img_dct = cv2.dct(img1)

# 压缩图像
zip_len = [10, 20, 50, 100, 200, 300, 500, 800]  # 压缩后的图像大小

for i in range(len(zip_len)):
    # 进行逆离散余弦变换：仅保留左上角的部分数据
    img_recor = cv2.idct(img_dct[0:zip_len[i], 0:zip_len[i]])
    print("img_recor.shape:", img_recor.shape)

    # 画图
    plt.subplot(2, int(len(zip_len) / 2), i + 1)
    plt.title("zip_len={zip_len}".format(zip_len=zip_len[i]), fontsize=12, loc="center")
    plt.axis('off')
    plt.imshow(img_recor, cmap="gray")

plt.savefig('compress.jpg', dpi=400, bbox_inches='tight')
plt.show()

核心代码：

cv2.idct(img_dct[0:zip_len[i], 0:zip_len[i]])

使用 $\mathsf{DCT}$ 进行图片压缩的本质，就是仅保留部分左上角的 $\mathsf{DCT}$ 系数，通过逆变换构建被压缩了的图像。

效果如下：

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/m0_64140451/article/details/139248718

数字水印 | 离散余弦变换 DCT 基本原理及 Python 代码实现

DCT(离散余弦变换)算法原理和源码(python)

离散余弦变换（DCT）的C++实现

JPEG压缩原理与DCT离散余弦变换

离散余弦变换(DCT)原理及应用

数字水印DCT变换域算法实现

基于离散余弦变换（DCT）傅里叶变换（DFT）小波变换（DWT）的彩色图像数字水印的嵌入、提取简介及MATLAB实现

基于DCT离散余弦变换的自适应水印算法的设计

离散余弦变换(DCT)

离散余弦变换DCT

基于DCT变换（变换域）实现信息隐藏(数字水印)原理详解及matlab实现

基于python+opencv的DCT(离散余弦变换)实验

离散傅里叶变换DFT、离散余弦变换DCT、离散正弦变换DST，原理与公式推导

JPEG压缩原理与DCT离散余弦变换量化

数字水印 | 混沌逻辑斯谛映射（Chaotic Logistic Map）基本原理及 Python 代码实现

离散余弦变换（DCT）的来龙去脉

DCT 离散余弦变换 DiscreteCosineTransform

初学DCT(离散余弦变换)

在python3下使用OpenCV做离散余弦变换DCT及其反变换IDCT

基于Python二维离散余弦变换（DCT）及其反变换（IDCT）---程序对比

HEVC原理-图像的二维变换与离散余弦变换（DCT）

数字图像处理（作业二）——离散余弦变换（DCT）的应用

离散余弦变换原理及实现【转载】

离散余弦变换原理及实现过程【转载】

MATLAB分析图像的离散余弦变换（DCT）

DCT 离散余弦变换及蝶形算法

离散余弦变换DCT（Discrete Cosine Transform）

离散余弦变换滤波算法（DCT）

【图像处理】：DCT离散余弦变换

理解DCT与DST【二】：离散余弦变换

今日推荐

deepseek热度已过？

MOOC习题:“GPS数据处理”题目个人解析(C语言)

DeepSeek接入微信公众号小白保姆教程

图+语义：RDF语义处理组件Neosemantics功能列表

大语言模型Prompt工程之使用GPT4生成图数据库Cypher

大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher

GPT-3.5 生成 Fabric Cypher

生成 Cypher 能力：GPT3.5 VS ChatGLM

LangChain 2 ONgDB：大模型+知识图谱实现领域知识问答

生成 Cypher 能力：MOSS VS ChatGLM

Neo4j/ONgDB 图数据库快速处理 Excel 文件

LangChain-Agents 入门指南

周排行

blog公告

Lucene：基本增删改查（Java方式）

1、类库

android环信集成单聊功能

删除数据库表数据SQL语句

rhel6.3安装Percona XtraDB Cluster 5.7时错误的解决方法

天梯赛-堆栈（线段树）

ES6原生Class

20120607

张正友标定算法原理详解

每日归档

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)

2025-04-02(0)