얼굴 인식 시스템 기술 솔루션

1. 소개

인공 지능 기술의 급속한 발전으로 많은 커뮤니티 또는 사무실 건물에서 얼굴 인식 지능형 액세스 제어 시스템을 사용했습니다. 오늘날 많은 곳에서 사무실 건물을 식별하기 위해 카드를 스와이프할 필요가 없지만 건물에 들어가기 위해 얼굴을 스와이프하기만 하면 됩니다. 새로운 생체 ​​인식은 기존 식별 방법을 대체합니다.

얼굴 인식 작업은 얼굴 특징 추출과 얼굴 인증의 두 부분으로 나뉩니다.

얼굴 특징 추출

얼굴 특징 추출은 얼굴의 이미지 특징을 기반으로 판단해야 합니다. 이 특징은 그 사람에게 속합니다. 얼굴 이미지 특징을 추출하는 두 가지 방법이 있습니다.

  • 얼굴 픽셀을 기반으로 고차원 추상적인 특징을 집계(피부, 얼굴 특징은 이미지 분류와 유사)
  • 얼굴의 특징점을 기반으로 한 특징은 실제로 이전 방법을 기반으로 얼굴의 특징점을 추가하는 것과 동일합니다(얼굴의 특징점 위치는 고차원 추상적인 얼굴 특징을 기준으로 결정되기 때문입니다. )

얼굴 키 포인트 기반 기능

다음 그림은 얼굴 키 포인트 기반의 세부적인 얼굴 인식 알고리즘 프로세스를 보여줍니다.
여기에 이미지 설명 삽입
키포인트 감지 방법은 일반적으로 두 가지 유형으로 나눌 수 있습니다.

  • 하나는 좌표 회귀를 사용하여 해결하는 것입니다.
  • 하나는 핵심점을 히트맵으로 모델링하고 픽셀 분류 작업을 통해 히트맵의 분포를 회귀하여 핵심점 위치를 얻는 것입니다.

이 두 가지 방법은 모두 수단이자 방법입니다. 해결해야 할 문제는 이미지에서 이 지점의 위치와 관계를 찾는 것입니다. 자국어로는 픽셀의 위치와 주변 컨텍스트( 주변 픽셀)에는 특정 조합이 있습니다.

얼굴 인증

얼굴 인증은 현재 사진의 얼굴이 이미 데이터베이스에 있는 사람인지 여부이며 일반적으로 두 가지 방법이 있습니다.

  • 직접분류, 정확한 인물 구분 및 라벨 출력(이미지분류)
  • 이진 분류 문제로 변환, 즉 두 개의 얼굴 사진으로 구성된 사진 쌍의 얼굴이 동일 인물인지 구별하고 출력은 동일 인물의 신뢰 수준

첫 번째 방법은 모델 교육이 완료되면 언제든지 새로운 사람을 추가할 수 없고 데이터베이스의 각 사람이 더 많은 얼굴 데이터를 수집해야 하고 이미지 분류의 정확도가 높지 않은 등 많은 단점이 있습니다.

두 번째 방법은 일반적으로 Siamese 네트워크에 의해 구현되며 일반적인 구조는 다음과 같습니다
여기에 이미지 설명 삽입
.

  • 동일한 CNN 네트워크를 통해 얼굴 사진을 동일한 방식으로 인코딩하여 고차원 벡터 공간에 임베딩
  • softmax loss를 loss function으로 사용하여 두 sample embedding vector의 splicing에 대한 two-class training을 직접 수행하여 model이 두 sample 간의 유사도를 직접 출력할 수 있도록 하고 유사도가 특정 임계값에 도달하면 다음과 같이 판단한다. 같은 사람의 얼굴
  • 또는 삼중항 손실, 대조 손실, 중심 손실 및 기타 손실 기능을 사용하여 CNN 네트워크를 최적화하여 최종 인코딩된 고차원 벡터 공간에서 유사한 샘플 간의 거리를 줄이고 다른 유형의 샘플 간의 거리를 확대합니다.
  • 그런 다음 두 샘플의 유사도를 두 샘플 임베딩 벡터 사이의 거리로 측정하고 유사도가 일정 임계값에 도달하면 동일인의 얼굴로 판단한다.

2. 기술 솔루션

얼굴 인식 시스템은 신경망 딥 러닝 알고리즘과 대용량 데이터 저장 빅 데이터 컴퓨팅 기술을 기반으로 분산 클러스터 기술을 사용하여 비디오 감시 이미지, 얼굴 인식 이미지를 구현합니다.

프론트 엔드는 비디오 스트림 또는 사진 스트림 모드를 채택하여 비디오 이미지를 전송하고 장면 환경의 얼굴 이미지를 제공하며 얼굴 캡처 라이브러리를 형성합니다.

여기에 이미지 설명 삽입

얼굴 인식 서비스에는 인증 모드와 검색 모드의 두 가지 주요 모드가 있습니다 .

  • 인증 모드 ( 1:1 1:11:1 ) 수집된 이미지 또는 지정된 이미지가 데이터베이스에 등록된 객체와 비교되어 동일인인지 여부를 확인하는 것이다. 1:1 1:11:1 은 본인 확인 모드로 기기에서 수집한 본인 사진과 신분증 사진의 얼굴 특징을 비교하여 동일인인지 확인하는 모드로 실명확인이 필요한 시나리오에서 주로 사용하는 모드입니다.(비행기에서 보안 검색대 통과 시 공통)
  • 검색 모드 ( 1 : n 1:n1:n )은 데이터베이스에 등록된 모든 이미지를 검색하여 지정된 이미지가 있는지 확인하는 것을 의미합니다. 1:n 1:n1:n 은 인물의 초상화를 수집한 후 방대한 인물 데이터베이스에서 현재 사용자의 얼굴 데이터와 일치하는 이미지를 찾고, 데이터베이스 비교를 통해 상대방의 신원을 식별하는 것이다.(커뮤니티 접근 통제)
    여기에 이미지 설명 삽입

두 번째 는 1:n 1:n1:n 의 얼굴 데이터베이스는 세 가지 비즈니스 데이터베이스로 나뉩니다.

  • 얼굴 스냅샷 라이브러리: 과거 스냅샷 장면 사진, 얼굴 축소판 및 구조화된 얼굴 특징 데이터, 스냅샷 위치, 스냅샷 시간 및 기타 정보를 포함합니다. 이 라이브러리의 주요 비즈니스 응용 프로그램은 사진 검색 및 비교, 대상 인물의 초상화 존재 여부 쿼리 위치, 시간, 궤도 추적 등
  • 얼굴 등록 데이터베이스: 주로 지역 사회 보장 초상화 정보 데이터베이스 및 도시 인구 정보 데이터베이스와 같은 일부 대규모 인물 사진, 구조화된 얼굴 특징 데이터 및 신원 정보를 가져옵니다. 가져오기 후 주요 응용 시나리오는 이미지 검색 비교 및 ​​신원 정보 정보 조회 입니다. 사람의 신원을 확인하기 위해.
  • 블랙리스트 라이브러리: 고위험 인원 및 특수 인원의 얼굴 사진이 포함되어 있으며 주요 응용 시나리오는 얼굴 비교 및 ​​각 검문소의 실시간 군중 흐름 조기 경고입니다.

엔:엔:엔N:실제로 "누가 누구인지 증명"하는 데 사용되는 여러 1:N 인식과 동일한 N 시나리오가 상대적으로 적습니다.

3. 안면인식 기술 확대

3.1 얼굴 데이터 모델링 및 검색

얼굴 데이터 모델링 및 검색 라이브러리에 등록된 얼굴 이미지 데이터를 모델링하여 얼굴의 특징을 추출하고 생성된 얼굴 템플릿을 데이터베이스에 저장할 수 있습니다. 얼굴 검색에서는 지정된 얼굴 이미지를 모델링하여 데이터베이스의 소유자 템플릿과 비교하고 마지막으로 비교된 유사도 값에 따라 유사인 목록을 나열합니다.

3.2 동적 활성 감지

과거에는 고정된 얼굴 인식이 지정된 영역 또는 범위 내에서 수행되었으므로 거리 및 위치에 대한 인식 요구 사항이 상대적으로 높을 것입니다. 정적 얼굴 인식의 특징은 사용자 용량이 작고 보안 성능이 높지 않으며 때로는 사진이 인식 검증을 통과 할 수 있다는 것입니다. 이제 동적 얼굴 인식 액세스 제어가 시작되었으며 시스템은 상대방이 실제 사람인지 사진인지 식별할 수 있습니다.

라이브 감지 기능으로

은행 앱, 일반 응용 프로그램에서 시스템은 사용자에게 몇 가지 작업(예: 깜박임, 입을 벌리기, 머리 흔드는 등)을 완료하라는 메시지를 표시하여 사용자가 살아 있는지 여부를 확인합니다.

여기에 이미지 설명 삽입

3.3 이미지 품질 감지

이미지 품질은 인식 효과에 직접적인 영향을 미칩니다. 이미지 품질 감지 기능은 사진의 이미지 품질을 평가하고 식별을 돕기 위해 해당 권장 값을 제공할 수 있습니다.

미래에는 점점 더 많은 도시가 지능화되고 기술 중심의 제품은 시민의 삶을 더 편안하게 만들고 삶의 질을 향상시키며 천연 자원을 절약할 것입니다.

추천

출처blog.csdn.net/weixin_42010722/article/details/125893896