opencv-convolution en imágenes

circunvolución

Que es la convolución

La convolución en sí es un concepto matemático, pero más, a menudo escuchamos en el aprendizaje profundo: red neuronal convolucional. Pero aquellos que realmente estudian las redes neuronales centrales encontrarán que en realidad están estudiando matemáticas. Además del aprendizaje profundo, la convolución se ve a menudo en la visión por computadora y a menudo se usa en el procesamiento de imágenes.

El principio matemático de convolución.

Primero, echemos un vistazo a la definición de convolución:

En análisis funcional, convolución, convolución o convolución (inglés: Convolution) es un operador matemático que genera la tercera función a través de dos funciones f y g, que caracteriza la superposición de la función f y g después de voltear y traducir La integral del producto de valores de funciones parciales sobre la longitud de superposición.

Mi entendimiento es el siguiente

Volumen: la inversión y traducción de dos funciones se puede entender como las dos funciones se entrelazan y se enrollan juntas a través de cálculos.

Producto: integral (esencialmente la suma de operaciones)

Convolución de datos continuos

Inserte la descripción de la imagen aquí
Esta integral define una nueva función h (x), llamada convolución de la función f y g, denotada como h (x) = (f * g) (x).

Convolución de datos discretos

Inserte la descripción de la imagen aquí
Comprender el proceso de convolución a través de la discretización.

Inserte la descripción de la imagen aquí
A la izquierda hay una imagen, seguida de la imagen después de la operación de convolución, y la matriz bidimensional de 3 × 3 en el medio es un núcleo de convolución. El proceso de cálculo específico es el siguiente:

31 = (15 1 + 17 1 + 19 1 + 56 1 + 18 1 + 20 1 + 97 1 + 19 1 + 20 * 1) / 9

Inserte la descripción de la imagen aquí
El núcleo de convolución recorre cada punto de izquierda a derecha, de arriba a abajo.

Máscara

Inserte la descripción de la imagen aquí
El proceso de cálculo de la operación de la máscara es el siguiente:

1 * 0 + 2 * (-1) + 3 * 0 + 2 * (-1) + 3 * 5 + 4 * (-1) + 3 * 0 + 4 *
(-1) + 5 * 0 = 3

No tenemos promedios en la operación de máscara, y nuestra operación de máscara es diferente de la verificación de la operación de convolución, pero el proceso de cálculo es muy similar, así que no lo confunda.

Defina la imagen como I (x, y) y el núcleo como G (i, j), donde 0 <i <Mi-1 y 0 <j <Mj-1, y el punto de anclaje se encuentra en (ai, aj ) coordenadas del kernel correspondiente. Entonces, para lo anterior, podemos obtener la fórmula de cálculo de la siguiente manera:
Inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/qq_28258885/article/details/112609905
Recomendado
Clasificación