이미지 처리 SIFT 및 SURF 알고리즘에 대한 자세한 설명

图像的特征点检测是图像配准的第一步,下面将为大家介绍尺度不变特征检测(SIFT)和加速鲁棒特征检测(SURF)两种算法。

하나, SIFT 알고리즘

SIFT 알고리즘은 고정밀 특징점 감지 알고리즘입니다. 이 알고리즘에 의해 감지 된 특징점에는 매우 강력한 스케일, 그레이 레벨 및 방향 정보가 포함됩니다. SIFT 알고리즘의 특징점 감지는 이미지의 스케일 공간에서 수행되어야하며 스케일 공간은 이미지의 컨볼 루션과 가우스 함수에 의해 생성됩니다. 가우스 함수는 다음과 같이 정의됩니다.
여기에 사진 설명 삽입
이미지 축척 공간 L (x, y)은 다음과 같이 계산됩니다.
여기에 사진 설명 삽입
1. 축척 공간
피라미드 하단의 이미지가 가장 선명하고 원본 이미지 크기의 두 배입니다. 이미지가 첫 번째 그룹의 첫 번째 레이어로 표시 될수록 더 흐릿하게 올라갑니다. 구성의 첫 번째 단계는 그룹의 두 번째 레이어로 하단 이미지에 가우시안 필터링을 수행하고 새로 생성 된 이미지에 대해이 작업을 반복하고 여러 작업 후에 설정된 이미지가 그룹을 형성 한 다음 그룹에서 가장 많이 흐리게 이미지가 2 배 다운 샘플링됩니다. 즉, 이미지의 길이와 너비가 원본의 절반으로 줄어 듭니다. 그러면 이미지 크기가 원래 이미지 크기의 1/4이됩니다. 새로 생성 된 이미지를 다음 그룹의 초기 이미지로 사용하고 위의 단계를 반복하여 그림과 같이 가우시안 피라미드의 구성을 완료합니다. 같은 그룹의 이미지 크기는 동일합니다. 구성 할 가우시안 피라미드의 그룹과 레이어의 수가 각각 m과 n이라고 가정합니다. 그러면 (m, n)은 그것이 나타내는 축척 공간입니다.
가우스 구성 과정의 개략도
미분 가우시안 피라미드는 가우시안 피라미드 [38]를 기반으로 추가로 구성됩니다. 가우시안 피라미드의 첫 번째 그룹의 두 번째와 첫 번째 레이어의 차이에 의해 형성된 이미지는 미분 가우시안 피라미드의 첫 번째 그룹의 첫 번째 레이어로 사용되며 세 번째 레이어와 두 번째 레이어의 차이에 의해 형성된 이미지 가우시안 피라미드의 첫 번째 그룹의 차이로 사용됩니다. 가우스 피라미드의 첫 번째 그룹과 두 번째 레이어 ...이 규칙에 따라 생성 된 이미지는 미분 가우스 피라미드를 구성하므로 각 그룹의 레이어 수는 미분 가우시안 피라미드는 해당 가우시안 피라미드 그룹의 레이어 수보다 하나 적습니다. 계산 공식은 다음 공식에 나와 있습니다.
여기에 사진 설명 삽입
DOG 건설 과정의 개략도

2. 극한 점 검출
DOG의 구축이 완료된 후 내부 극한 점의 안정된 특성상 특징점 후보로 찾아서 활용하기위한 알고리즘 전략이 필요하다. 즉, DOG의 각 지점을 검색하여 극한 지점으로 조건을 만족하는지 여부를 판단합니다. 판단의 근거는이 점을 3 차원 공간의 인접 픽셀 (즉, 레이어 주변의 8 개 픽셀과 다음 두 레이어의 인접 픽셀 9 개, 총 26 개)과 비교하여 이것이 있는지 확인하는 것입니다. 포인트는 스케일 공간의 최대 또는 최소입니다. 비교에 의해 포인트가 26 개 포인트 중 가장 높은 경우 해당 포인트는 감지 된 극단 포인트입니다.
극한 가치 프로세스 결정

3.
특징점 포지셔닝 특징점 포지셔닝은 가장자리에서 부정확 한 점이나 노이즈 간섭에 취약한 점을 제거합니다 .3 차원 2 차 함수 모델이 감지 된 극단 점에 맞춰져 핵심 점의 위치와 위치를 결정합니다. 보간은 이산 이미지 표현을 연속 함수로 표현해야하므로 가우스 차이 함수의 Taylor 급수 확장 :
여기에 사진 설명 삽입
미분 D는 극단 점의 정확한 위치를 얻을 수 있고 미분 0을 얻을 수 있습니다.
여기에 사진 설명 삽입
if | D (xmax) <= 0.03 |는 노이즈 간섭에 취약한 저 대비 점이므로 제거하고 그렇지 않으면 유지하십시오.
영상의 가장자리 응답 점을 제거하기 위해서는 주 곡률을 계산하기 위해 2 * 2 Hessian 행렬이 필요합니다
여기에 사진 설명 삽입
.D의 주 곡률은 H의 고유 값에 비례하기 때문에 비율에 따라 계산할 수 있습니다. H 행렬의 순위 T®와 행렬식 Det (H) 에지 응답 점인지 확인합니다. α와 β를 각각 Hessian 행렬 H의 두 고유 값으로 설정 한 다음 :
여기에 사진 설명 삽입
다음 공식 2-15가 참인지 확인하여 주 곡률과 임계 값 간의 관계를 결정합니다.
여기에 사진 설명 삽입

4. 극단 점의 기울기 방향 결정
감지 된 특징점에 회전 불변성이 있어야한다는 요구 사항을 충족하려면 특징점에 방향을 제공해야합니다. 이 방향은 특징점이있는 로컬 이미지 구조를 통해 이미지 그라디언트를 사용하여 얻습니다.
여기에 사진 설명 삽입
특징점 (x, y)에서 기울기 값 m (x, y) 및 기울기 방향 θ (x, y)는 다음 공식에 의해 구합니다. 여기서 L (x, y)는 특징점 ( x, y).
위의 공식에 의해 계산 된 주변 픽셀의 특징점의 기울기 값 m (x, y) 및 기울기 방향 (x, y)은 히스토그램으로 계산됩니다. 그림 2-5에서 볼 수 있듯이 횡축은 0-45도, 45-90 도와 같은 방향 간격을 나타내고, 세로축은이 간격의 특징점의 기울기 값의 합을 나타냅니다. 시공 방법은 원주 360o를 45 도마 다 한 열씩 8 개의 열로 나누는 것입니다. 그래디언트 히스토그램에서 가장 높은 막대의 값은이 특징점의 주된 방향을 나타냅니다. 또한 값이 가장 높은 값의 80 % 이상에 해당하는 다른 막대가있는 경우이 막대의 방향은 다음과 같이 설정됩니다. 이 특징점의 보조 방향입니다.
그라디언트 히스토그램의 구성

특징점 디스크립터 생성
: 회전 각도 때문에 순서 특징점의 주축 방향의 방향이 균일 한 회전 불변 특징 벡터을 보장하는 것이, 처리는 아래의 근방의 화상의 특징점
기능 설명 자의 형성
특징점하여 이웃의 픽셀은 16 개의 하위 도메인으로 분할되고 16 개의 하위 도메인을 포함하는 정사각형은 블록이며 총 4x4 블록입니다. 각 블록의 기울기 히스토그램 (8 방향)을 개별적으로 계산합니다. 처리 후, 4x4x8 = 128 차원 특징 설명자가 획득됩니다.

2. SURF 기능 감지

SURF는 SIFT 알고리즘을 기반으로 한 개선 된 특징 감지 알고리즘으로 SIFT 알고리즘의 높은 정확성과 견고 함의 장점을 가지고 있습니다. 알고리즘 흐름은 SIFT와 유사합니다.
1. 특징점의 위치
Hessian 검출기는 더 많은 안정성과 반복성의 장점이 있기 때문에 SURF 알고리즘은 먼저 검출기를 사용하여 특징점을 검출합니다. 이미지 필터링 프로세스는 이산 이미지 함수 f (x, y)를 사용하여 가우시안 함수의 고차 미분을 컨볼 루션하여 얻을 수 있습니다. SIFT 알고리즘의 요점 포지셔닝과 유사하게 SURF는
픽셀 포인트를 3 차원 공간에서 26 개의 주변 헤세 행렬 결정자와 비교합니다 . .

2. 특징점의 방향 결정
좋은 회전 불변성을 얻기 위해 영역을 정의하고 해당 영역의 Harr 웨이블릿 응답을 계산하여 특징점의 주 방향을 구합니다. 이 영역의 범위는이 특징점을 중심으로하고 반경이 눈금의 6 배인 원입니다. Haar 웨이블릿의 템플릿은 그림에 나와 있습니다
Harr 웨이블릿 응답 템플릿
. 위 그림의 템플릿 은 다양한 방향의 Harr 응답을 보여줍니다 . 검정색과 흰색은 각각 -1과 1을 나타냅니다. 위의 템플릿을 사용하여 구분 된 영역의 포인트를 처리하면 각 특징 포인트의 응답을 두 방향으로 얻을 수 있습니다.
SURF 알고리즘 요점 주요 방향 할당
그런 다음 템플릿 처리 후 응답에 대해 가우스 가중치가 수행됩니다. 마지막으로, 윤곽이있는 원형 영역에서 60도 섹터를 사용하여 x 및 y 방향의 총 Harr 웨이블릿 기능 수를 계산합니다. 부채꼴 모양이 일정 간격으로 회전하고 반복 통계 연산이 수행되며, 통계 값이 가장 큰 부채 모양의 최종 방향이 특징점의 주 방향입니다.

3.
특징점 서술자 생성 SURF 알고리즘에 의해 생성 된 최종 특징 서술자는 다음 과정을 거쳐야합니다 : 특징점 근처의 정사각형을 선택하고 16 개의 작은 정사각형 영역으로 나눕니다 (각 작은 정사각형은 측면 길이가 5 초). 선택한 사각형의 방향은 특징점의 방향과 일치합니다. 그런 다음 4x4 정사각형 영역
에서 픽셀의 harr wavelet 특성을 계산합니다. 픽셀 수는 25 개입니다. 통계에는 dx, dx, dy 및 dy가 포함됩니다. 각 영역에는 4 개의 통계 값이 있으므로 그림과 같이 측면 길이가 20 초인이 정사각형 영역은 4 × 4 × 4 = 64 치수가됩니다.
설명자 벡터 구성의 개략도

저작권 : Dong Shuai, 재 인쇄 소스를 지정하십시오.

추천

출처blog.csdn.net/weixin_44612221/article/details/106672931