종이 검출 타겟 (3)의 해석 - 패스트 R-CNN

배경

  깊은 ConvNet 상승, VGG16 잘 수행하기 위해 이미지 분류 작업에 사용,이 종이 VGG16는 검사 작업을 해결합니다. 단점 CNN 층 전에 훈련 방법이없는 미세 튜닝 SPP NET 및 여러 단계, 피쳐 추출 + SVM 분류 + 프레임 창으로 분할된다 수 고속 R-CNN에 이러한 문제가 해결되었다.

방법

  네트워크 모델은 SPP NET에 비해 다음과 같은 개선, VGG16 구조를 채택.

  ROI 풀링

  최종 층은 최대 풀링 층 풀링 ROI를 교체, SPP NET, 피라미드의 한 층의 특수한 경우로 간주 될 수 있으며, 기능 맵은 최대 풀링 같이 빈 시간 *의 W로 분할된다.

  BBOX의 회귀

  완전히 연결된 각각 층, 출력 정렬 위치 결과를 이용하여 두 개의 서로 다른 네트워크를 종료 종단의 교육 프로세스를 달성했다.

  CNNs 매개 변수 업데이트

  사실, SPP NET도 업데이트 할 수 없습니다 매개 변수 CNNs하지만 SPP의 NET 먼저 ROI 사진의 무리를 추구하기 때문에 같은 비용이 너무 높은, N 장 무작위로 훈련 중단 후 ROI는 다양한에서 올 수 있습니다 당신 확산을 되돌리고 싶은 경우, 당신은 훈련을 저장해야하므로 사진, 각 계층의지도에서이 사진을 특징으로, 거대한 오버 헤드, 빠른 R-CNN은 단지 원래의 R = 2 장는 N 투자 수익 (ROI)을에, 계층 적 사고를 사용 이러한 저장 두 사진을 사용하여 계산되고, 상기 비용은 크게 감소된다.

개요

  그것은되는 엔드 투 엔드로 SPP NET 개선 훈련 프로세스에 기초하여 이루어지는, 전체 네트워크 파라미터를 갱신 할 수있다.

결점

  ROI 추출 방법 사용 또는 SS.  

 

추천

출처www.cnblogs.com/xin1998/p/11374221.html