표적 탐지 : R-CNN 원리

논문 주소 :

한 선택적 검색 :     https://arxiv.org/pdf/1502.05082.pdf

이 R-CNN :                     https://arxiv.org/pdf/1311.2524.pdf

(1) 개요 :
2K 주변, 창, 타겟을 포함하는 후보 블록의 위치를 이용 선택적 검색 방법을 슬라이딩에 의한 시간 소비, 이에 따른 2K의 다음 기본 블록을 줄이기 위해 순차적 CNN을 훈련 잘라

[선택적 됨] 설명 :도 전진, 즉, 타겟이 발생할 수있는 후보 영역 (지역 안을)의 위치. 이미지 질감, 모서리, 색상 정보를 사용하는 것은 적은 (수천 또는 수백)을 선택 윈도우의 경우 높은 회수율 (리콜)을 유지하기 위해 보장 될 수있다

 

단계 2 :
imagenet 미리 열차 2.1 분류기 CNN
이미지 사진 절단 선택적 검색 방법을 이용하여 2.2
2.3 균일 한 크기로 크기 조정 된 이미지를 잘라
사전 훈련 CNN 미세 조정을 수행하여 2.4, 전체 출력 카테고리 N +1, 1이 경우 잘 CNN 저장 훈련 작은 LR 요구, 배경을 나타내는
CNN 층의 마지막 훈련 분류를 제거 2.5 2.4 단계의 출력과 상기 중간 일차원 특징 벡터 후보 영역마다 잔상이 CNN, 디스크에 대한 출력 특징 벡터 기억
각 카테고리는 SVM 훈련을위한 순차 입력 샘플 2.5 특징 벡터 (양 경우 IOU 후보 영역> = 후보 영역 0.3의 실제 영역을 제외 예와 다른)
위치 매개 변수 상자의 2.6 리턴 손실 교육 목표

 

상자 반사 손실은 설명합니다 :

가설 예측 모델 출력 D I P = (P), (P의 X를 , P Y , P W , P H는 ) 중심의 후보 영역의 폭과 높이, G = (G의 좌표를 X , G Y , G W , G H 중심의 진정한 대상으로 폭 및 높이)의 좌표

 

1 L2 정규화 파라미터 값은 슈퍼 결정된 교차 검증 방법.

계산 리턴 손실에 관련된 2 만 IOU> = 0.6 만 후보 영역

 

3 개 단점
3.1 선택적 검색 처리가 느린
3.2 2K, 반복 큰 영역, 중복 정보가있는
3.3 4 모듈 (선택적 됨, CNN은, SVM, 회귀)이 각각 분리되어이

추천

출처www.cnblogs.com/dxscode/p/11443374.html