论文 解读 1 - 정확한 물체 감지 및 의미 분할을위한 풍부한 기능의 계층 구조

배경

  2012 Imagenet LSVRC 게임에서 Alexnet는 맨-5 15.3 %의 오류율을 쉽게 (26.2 %의 두 번째 상위 5 오류율) 위에 나와의. 따라서, convNet 잠재력 널리 히트, 인식된다. convNet 이미지 분류 작업에서 좋은 결과를 얻을 수 있기 때문에, 표적 탐지 작업에 넣을 수도 없습니다. 이 논문은 표적 탐지 작업을 해결 convNet 사용을 탐구 처음이다. 파스칼 VOC 2010 년지도는 53.7 %에 달했다.

방법

  모델은 모두 세 가지 모듈로 나뉘어.

  (1) 영역 제안) (영역 권장). 대상 탐지 작업 분류를 할뿐만 아니라 때문에 허우는 목표 상자를 수행했다, 위의 전체보기 상자를 많이 생산하고 있습니다. 사실, 여기가 생각의 통과, 대상 목록 그들 모두의 첫째 가능한 위치, 하나 개의 분류로 그 다음이다. 여기에 사용 된 선택적 검색 알고리즘이다.

  (2) 특징 추출 (특징 추출). 이 제품은 제 5 전환 층 전면 개의 FC 층 AlexNet 피쳐 추출하여 이미지를 상기 224 * 3 * 224]를 생성한다 (참고 : 부 영상을 생성하는 단계 (224) * 3 * 224 크기를 뒤로 FC 때문에 층을 수신하는) 고정 길이 벡터, 그것은 궁극적으로 특징 벡터의 4096-D를 제조한다.

  (3) SVM 분류. 4096-D 각각에 대한 SVM 분류 특징 벡터를 사용하는 방법. FC 층 중 하나 뒤에 일본어 분류 AlexNet이 벡터는 4096-D (N은 클래스 수이다)의 Nd로 변환 유의하고 softmax를 분류 알고리즘을 수행. 저자는 실험 SVM 방법 더 나은 때문에이 방법을 사용하지 않는 이유.

개요

  찾을 수 RCNN 간단한 원리는 다음 N 생산 후 AlexNet (FC-softmax를 레이어 제거)에 투입되는 224 * 224 * 3, 서브 그래프 크기 조절도 선택적 검색 알고리즘의 전체 뷰 n 번째 생성 4096-D는 SVM 분류 알고리즘을 갖는 벡터이다.

  그래서 산에 대한 convNet에 의한 표적 탐지, 기존의 방법보다지도 모델의 문제 해결에 기여하는 더 많은 사람들이 convNet에 의해 표적 탐지의 문제를 해결 할 수 있도록합니다.

결점

  (1) 과정의 단점은 사진, 시트 서브 그래프의 수천을 생산하는 디스크 공간을 많이 차지하기 위해, 먼저이 너무 폭력 분명하다;

  (2) 비 효율성이있다, 우리는 중복 계산의 많은 수의 결과로 확실하게 겹치는 부분이 많은이 중복되는 부분이 별도로 계산해야 한 사진의 수천을 찾을 수 있습니다.

추천

출처www.cnblogs.com/xin1998/p/11371615.html