네트워크 설계에 미치는 VGG 어떤 독특한 통찰력?
-
-
작은 컨볼 루션 커널을 사용합니다 . 세 7 × 7에 대응하는, 5 × 5 수용 필드에 대응하는 두 개의 3 × 3 컨볼 루션 커널을 스태킹. 수용 필드 범위를 유지하는 대신에 작은 컨벌루션 컨벌루션 큰 복수 사용하는 경우에는, 우선, 계산량을 저감 번째 표현 비선형 활성화 함수의 복수의 도입을 증가시키는 것이다.
-
-
-
224 사이즈의 이미지 밖으로 큰 그림 작물과 같은 크기 Alexnet. 그러나 특정 임의 작물 또는 작물 트래버스 논문은 지정하지 않았습니다. 어떻게 사진의 큰 크기를 얻으려면? 하나는 크기가 S = 256, 384 고정 직접 스케일링하는 짧은 가장자리이다. 또이 랜덤 S 256-512 범위의 화상이 고정되지 스케일을 확장하고, 어떤 규모의 섭동의 동등한 유입된다.
-
첫 번째 그림은 추론 Q. 조정할 때 그러나 최종 점수는 두 가지 방법으로 계산되고, 최초의 멀티 작물 Alexnet 평균 방법은 계속됩니다. 또 다른 컨벌루션 변환 FC 네트워크를 충족하는 최종 출력은 단일 스코어 벡터에 공간 평균화를 통해 다음 스코어지도 위치 (채널 번호와 일치하는 분류 번호)이며
-
-
초기 선택의 순 중량 :
기울기의 역 연산 네트워크 심층이 불안정 해지는 경향이 네트워크 수렴하기 어려운 결과. 그래서 좋은 초기 값 더 중요한 교육 네트워크를 설정합니다. 가장 안정적인 초기 값은 사전에 훈련 된 모델 가중치를 사용하는 것입니다. 또한 열화가 잘립니다 기울기의 기울기에 의해 제어 될 수 추적을 통해 Resnet 네트워크 크게 (복잡한 그라데이션을) 어려움 깊이 네트워크 교육 문제를 완화
-
VGG 더 Alexnet 매개 변수보다 왜 오버 피팅 문제에 집중하지?
VGG 전체 네트워크 구조와 관련된 코딩 (joint-coding)
-
데이터 표준화는하지만, 실제 응용 프로그램은 BN을 추가 할 수없는 경우. 회선이 구성 블록도 2-2-3-3-3의 피처들의 크기를 변경하는 완전 풀 커널 = 2, S = (2)를 통하여. 완전 AlexNet 층과 연결 구체적 원래 서류를 참조 강하 개의 층을 갖는
! [화상 20,200,103,211,550,576 ( C : \ 사용자 \ qjbook \의 AppData \ 로밍 \ Typora \ typora 유저 이미지 \ 화상 20200103211550576.png )