CV 종이 노트 2 VGG

네트워크 설계에 미치는 VGG 어떤 독특한 통찰력?

  • 컨볼 루션 이상의 층을 사용 . vgg16 Alexnet 전반적으로 유사한 구조지만, 원래 하나의 컨벌루션 대신 블록 컨벌루션을 이용하여 스택.

  • 작은 컨볼 루션 커널을 사용합니다 . 세 7 × 7에 대응하는, 5 × 5 수용 필드에 대응하는 두 개의 3 × 3 컨볼 루션 커널을 스태킹. 수용 필드 범위를 유지하는 대신에 작은 컨벌루션 컨벌루션 큰 복수 사용하는 경우에는, 우선, 계산량을 저감 번째 표현 비선형 활성화 함수의 복수의 도입을 증가시키는 것이다.

  • 도 크기 특성 및 채널의 수는 단순한 관계를 유지 :도 후반의 각각의 셀은 감소 된 해당 크기에있어서 64 시작 회선의 채널 수를 512까지 채널의 차원 수를 두배.

 

우리는 몇 가지 문제에 집중해야

  • 샘플링 방법의 사진 :

    • 224 사이즈의 이미지 밖으로 큰 그림 작물과 같은 크기 Alexnet. 그러나 특정 임의 작물 또는 작물 트래버스 논문은 지정하지 않았습니다. 어떻게 사진의 큰 크기를 얻으려면? 하나는 크기가 S = 256, 384 고정 직접 스케일링하는 짧은 가장자리이다. 또이 랜덤 S 256-512 범위의 화상이 고정되지 스케일을 확장하고, 어떤 규모의 섭동의 동등한 유입된다.

    • 첫 번째 그림은 추론 Q. 조정할 때 그러나 최종 점수는 두 가지 방법으로 계산되고, 최초의 멀티 작물 Alexnet 평균 방법은 계속됩니다. 또 다른 컨벌루션 변환 FC 네트워크를 충족하는 최종 출력은 단일 스코어 벡터에 공간 평균화를 통해 다음 스코어지도 위치 (채널 번호와 일치하는 분류 번호)이며

  • 초기 선택의 순 중량 :

    기울기의 역 연산 네트워크 심층이 불안정 해지는 경향이 네트워크 수렴하기 어려운 결과. 그래서 좋은 초기 값 더 중요한 교육 네트워크를 설정합니다. 가장 안정적인 초기 값은 사전에 훈련 된 모델 가중치를 사용하는 것입니다. 또한 열화가 잘립니다 기울기의 기울기에 의해 제어 될 수 추적을 통해 Resnet 네트워크 크게 (복잡한 그라데이션을) 어려움 깊이 네트워크 교육 문제를 완화

  • VGG 더 Alexnet 매개 변수보다 왜 오버 피팅 문제에 집중하지?

    작은 종이 언급 한 회선은 어떤 정규화 영향을 미칠 수 있습니다. 한편 L2 정규화, 강하는 상이한 스케일 작물 확장 데이터가 존재하고, 이용된다. 전체 정규화 노력으로 VGG 네트워크는 정말 작지 않다. 따라서, 실제 작업은 오버 피팅의 저자가 발생 중요한 문제가되지 않을 수 있습니다.

VGG 전체 네트워크 구조와 관련된 코딩 (joint-coding)

  • 데이터 표준화는하지만, 실제 응용 프로그램은 BN을 추가 할 수없는 경우. 회선이 구성 블록도 2-2-3-3-3의 피처들의 크기를 변경하는 완전 풀 커널 = 2, S = (2)를 통하여. 완전 AlexNet 층과 연결 구체적 원래 서류를 참조 강하 개의 층을 갖는

! [화상 20,200,103,211,550,576 ( C : \ 사용자 \ qjbook \의 AppData \ 로밍 \ Typora \ typora 유저 이미지 \ 화상 20200103211550576.png )

추천

출처www.cnblogs.com/QJuse/p/12147285.html