문서 영상 처리 및 인식 문서 이미지 처리 및 인식 매뉴얼 핸드북

편집 : 데이비드 Doermann (메릴랜드 대학)
칼 Tombre (로렌 대학)

 

머리말

처음에는 단지 OCR 있었다. 일부 허위 시작되면, OCR은 1950 년대에 경쟁력있는 상업 기업이되었다. 나중에 십 년간 미국에서만 50 개 이상의 제조업체가 있었다. 마이크로 프로세서와 저렴한 광학 스캐너의 출현으로, OCR의 가격은 와인 한 병의에 수십 수천 수백 달러에서 떨어졌다. 소프트웨어는 전자 제품의 랙 난민. 1985 누군가에 의해 프로그램 수와 PC에 자신의 아이디어를 테스트 한 다음 (그리고 어쩌면 그것을 특허)에 대한 논문을 작성합니다.

처음 만 OCR. 몇 잘못된 시작되면 1950 년대에 OCR은 경쟁 기업이되었다. 나중에 10 년, 미국에서만 50 개 이상의 업체가있다. 와인 한 병의 가격 아래로 마이크로 프로세서와 저렴한 광학 스캐너, 수만에서 광학 문자 인식 가격과 수십만 달러의 출현과 함께. 소프트웨어는 전자 장비의 랙을 대체합니다. 1985 누구나 프로그래밍 할 수 있고 PC에 자신의 아이디어를 테스트 한 다음에 대한 논문 (심지어 특허)를 작성합니다.

우리는 약간의 실험 결과 현재 상업 방법에 대해 혹은 사내, 그러나 알고있다. 경쟁 산업은 게시 할 수있는 (그리고 특허는 법적 무기고의 일부가 될 수 있음) 부족 의욕을 가지고있다. 우리의 출판물 산업 저자의 부족은 고통스럽게 분명하다. 허버트 Schantz의 책, OCR의 역사는 예외였다 그는 1960 년대와 1970 년대의 주요 성공 사례 중 하나 REI의 성장을 추적. 그는 또한 널리 읽는 기계화하기 이전 오십년 '시도, OCR에 잡다한 위키 논문에 반영 이야기를했다. 기간의 다른 제조 업체 중 IBM은 자사의 제품에 대한 (하지만 종종 지연) 자세한 정보를 게시 혼자 서있을 수 있습니다.

그러나, 우리는 거의 현재의 내부 비즈니스 방법이나 결과에 대한 것을 알고있다. 경쟁 업계 게시하기위한 작은 동기 부여가 (자신의 특허법은 아스날의 일부가 될 수 있음). 업계의 부족한 우리의 출판물은 명백하다. 허버트 샌즈 책 "OCR 역사"는 예외입니다 : 그는 REI의 성장을 추적, REI는 1960 년대와 1970 년대의 주요 성공 사례 중 하나입니다. 그는 또한 널리 반영 위키 OCR 종이의 다양한 지난 50 년의 기계화를 읽으려고의 이야기를 알려줍니다. 기간의 다른 제조 업체에서, IBM은 개별적으로 (종종 지연 있지만) 자신의 제품에 대한 자세한 정보를 공개 할 수 있습니다.

문자 인식 (내 추정)에 1900 년 이후 발표 된 4000-8000 기사, 몇 백 대부분에서 정말 OCR에 부담 (기계로 해석 - 이제 소프트웨어 - 그 검색 가능한 디지털 형식으로 변환 표시 언어). 원형 분류 문제로 나머지 치료 문자 인식. 그것은 물론, 시연 및 패턴 인식에 새로운 아이디어를 설명하기위한 탁월한 차량에 문자 인식을 설정 적어도 일부 스크립트와 연구자들의 보편적 친숙. 우리 중 일부는 베고니아에서 진달래를 말할 수 있지만, 음자리표에서 날카로운 로그인하세요 천막 아치에서 루프, 백혈구에서 적혈구, 또는 배사에서 충적층은, 우리 모두가 읽는 방법을 알고있다.

그것은 지금 - 문자 인식 (내 생각) 1900 기사 때문에 출판 4000-8000에서, 기사 최대 실제 기계와 (검색 가능한 디지털 형식으로 변환하는 시각 언어로 이해 될 OCR은 관련 수백이있다 소프트웨어). 나머지 문자는 일반적인 분류 문제로 인식하고 있습니다. 문자 인식을 만드는 스크립트의 적어도 일부와 일반적으로 잘 알고 연구진은 쇼와 새로운 아이디어의 TELL 패턴 인식을위한 훌륭한 도구가 있기 때문에 물론, 그것은 정확하게이다. 날카로운 균열의 징후를 구별 할 수없는, 철쭉과 베고니아를 말할 수있는 우리 중 일부는, 그것이 텐트 아치 링을 구별 할 수는 없지만, 백혈구는 충적층 배사 구분하지 수, 적혈구 세포를 구별 할 수 있지만, 우리는 모두 알고 읽는 방법.

결국 초당 수천 개의 문자의 비율로 -까지 약 30 년 전, OCR은 고정 폭 OCR 글꼴과 타이핑 스크립트를 한 번에 하나 개의 문자를 인식하는 것을 의미했다. 워드 인식하기 어려운 세그먼트 조판 물질을 읽기 위해 따라 갔다. 워드 주파수없이 문자 N-g 주파수와 어휘보다 더 정교한 언어 모델의 값은 점차 분명 해졌다. 세계 인구의 절반 이상이 수개 국어이기 때문에 (헨리 베어드가 수행해야합니다 예측으로), OCR 너무 다국어되었다. 이 웹에서 과거의 모든 문화 유적을 게시 할 수있는 운동을 촉발. 많은 고대와 현대의 재료 기다리고 변환,의, 인간 가독성의 한계를 뻗어. 인간과 마찬가지로, OCR 구문, 스타일, 문맥과 의미를 최대한 활용해야합니다.

까지 약 30 년 전, OCR는 OCR 글꼴 간격 및 스크립트를 입력하는 단 하나의 문자를 인식하는 것을 의미하고, 궁극적으로 초당 수천 캐릭터의 속도에 도달. 단어 인식 방법은 자료를 게시의 경우 읽기의 어려움을 채택했다. 언어 모델의 값은 문자 N-g 주파수없이 사전에 나오는 단어 주파수보다 더 정교하다. 세계 인구의 절반 이상이 다국어 때문에 (예상 헨리 베어드 등), OCR는 다국어가되었다. 이것은 네트워크의 움직임에 과거의 모든 유물의 출시되었다. 많은 물질의 변환을 기다립니다, 고대 또는 현대 여부, 인간 가독성의 한계를 넘어입니다. 인간과 마찬가지로, OCR은 문법, 스타일, 문맥과 의미의 전체를 사용해야합니다.

많은 학술 연구자 OCR 훨씬 더 분류보다 것을 알고 있지만, 그들은 (그러나 점점 가까이있을 수 있습니다) 실행 가능한, 넓은 범위, 엔드 - 투 - 엔드 OCR 시스템을 개발 못하고있다. 언어와 문자 인식, 컬러 인쇄 기능, 열 및 라인 레이아웃 분석, 정확한 문자 / 단어, 숫자, 기호 및 문장 인식, 언어 모델, 문서 전체의 일관성, 조정 능력과 적응성, 그래픽 서브 시스템과 완벽한 OCR 시스템은, 효과적으로 내장 상호 작용 에러 정정 및 다중 출력 형식, 부분의 합보다 훨씬 많은 것이다. 또한, 시스템을 전문 - 우편 주소 읽기, 체크 읽기, 소송 및 처리 관료 형태의 - 또한 높은 처리량과 다른 오류-거부 절충이 필요합니다. 실제 OCR은 단순히 적절한 박사 학위 논문 프로젝트가 아닙니다.

많은 학술 연구자 OCR은 분류되지 않은 것을 깨달았 있지만, 그들은 엔드 - 투 - OCR 시스템의 실행 가능한, 넓은 범위를 개발하지 않은 (그러나 그들은 근접 할 수있다). 전체 OCR 시스템, 언어와 문자 인식, 컬러 기능, 열 및 행 레이아웃 분석, 정확한 문자 / 단어, 숫자, 기호 및 문장 부호 인식, 언어 모델, 문서의 일관성 범위, 조정 및 적응성을 인쇄 그래픽 서브 시스템은, 유효 매립 상호 복수의 출력 포맷의 에러 정정, 훨씬 더 많은 부분의 합보다. 또한, 특별한 시스템 - 우편 주소 읽기, 체크 읽기, 소송 및 처리 관료 형태 - 또한 높은 처리량을 요구하고 다른 오류의 무게를 거부했다. 진짜 OCR은 적절한 박사 학위 논문 프로젝트가 아닙니다.

나는 결코 알지 못할 콜 손 인쇄 인식 및 필기 인식 "OCR."할지 여부하지만 최신 주름의 규정 지능형 대기하다. 아무리 : 스타일러스 글리프를 추적하는 것은 퀼의 길을 간다 때까지 체류 여기 없다. 원고는 모두 인간과 기계 가독성은 작가의 동기 부여에 크게 의존 : 환불을 요청하는 핸드 프린트 소득세가 하나가 과소보고보다 더 많은 읽을 수 있어야 할 것입니다. 즉각적인 피드백, 온라인 인식의 가장 큰 장점은, 동기 강력한 형태이다. 인간은 여전히 ​​기계보다 더 배웁니다.

나는 규정 최신 주름으로 스마트 싫어 "OCR"라는 인식과 필기 인식 필기에 있는지 만 알 수 없습니다. 어느 쪽이든 : 퀼의 방향으로 스타일러스 모양의 움직임으로 묘사 될 때까지 그들은 여기에있을 것입니다. 인간과 기계의 가독성의 원고는 대부분 저자의 동기에 따라 달라집니다 적은보다 지불 쉽게 지문을 읽을 수 소득세 신고서의 환불을 요청할 수 있습니다. 즉각적인 피드백 온라인 식별의 주요 장점, 형태의 강력한 인센티브입니다. 인류는 여전히 기계 학습보다 낫다.

문서 이미지 분석 (DIA)은 OCR의 상위 집합입니다,하지만 다른 대중 서브 필드의 많은 OCR이 필요합니다. 거의 모든 라인 드로잉 텍스트가 포함되어 있습니다. 전자 규모의 전화 회사 그리기, 예를 들어, (개정 사항 포함) 3000 개 단어와 숫자에 대한 있습니다. 음악 점수는 피아니시모 같은 숫자 및 지침을 포함하고있다. 장소 이름과 높이가없는지도는 사용이 제한됩니다. 수학적 표현은 숫자 및 로그 제한 황갈색 또는 argmin 같은 알파벳 단편에 풍부하다. 좋은 문자는 우리가 지금 CAD로 전환되는 기존 도면을 그린 도안에 대한 주요 작업 자격이 될하는 데 사용됩니다. 불행하게도, 텍스트의 단락 길이의 세그먼트로 조정 상업 OCR 시스템은, 이러한 응용 프로그램의 전형적인 숫자 조각에 제대로 않습니다. 때 오픈 소스 OCR이 성숙, 아직 무거운 중량 개발자를 유치하지 않은 전문 응용 프로그램을 사용자 정의를위한 좋은 기회를 제공 할 것입니다. 한편, 텍스트와 라인 아트의 혼합을 포함하는 문서의 변환은 자신의 컨퍼런스 세션과 별개의 하위 분야들에겐 및 벡터화 복잡한 기호의 구성과 같은 해당 대상의 그래픽 기술 워크샵했다.

문서 이미지 분석 (DIA)은 OCR의 상위 집합이지만, 다른 인기있는 서브 필드의 많은 OCR이 필요합니다. 거의 모든 라인 드로잉의 텍스트가 포함되어 있습니다. 예를 들어, 전자 전화 회사 도면에 (개정 통지 포함) 약 3000 단어와 숫자. 디지털 음악 및 피아니시모 같은 지침을 포함. 아니 장소의 이름과 고도지도는 사용이 제한됩니다. 같은 로그, 제한, 황갈색 또는 argmin 같은 숫자와 문자의 조각 많은 수의 수학적 표현. 좋은 글꼴은 직업 자격의 주요 기초 자이며, 그들은 우리가 이제 기존의 CAD 도면으로 변환립니다. 불행하게도, 상업 OCR 시스템은 텍스트 단락의 세그먼트의 길이를 조정, 이러한 응용 프로그램의 전형적인 숫자 조각에 제대로 않습니다. 오픈 소스 OCR 성숙 할 때, 아직 구체적으로 개발자의 큰 숫자를 유치하지 않은 해당 응용 프로그램을 사용자 정의 할 수있는 좋은 기회를 제공 할 것입니다. 동시에 포함하는 텍스트와 라인 아트 변환 혼합 문서는 그들이 목표로 벡터화 및 기호 구성 및 기타 복잡한 그래픽 기술로 자신의 회의 및 세미나를 가지고, 서로 다른 하위 분야를 생산했다.

자동 또는 수동으로 전사 책, 기술 저널, 잡지와 신문에 무엇을해야 하는지를 DIA의 조사한다의 또 다른 서브 필드. 정보 검색 (IR)는 일반적으로 DIA의 일부 또는 고려되지는 않지만 그 반대, 그들 사이의 중복은 "논리적"문서 분할, 텍스트 참조 콘텐츠의 테이블, 연결의 그림과 삽화의 추출, 단어 얼룩을 포함한다. 반복되는 주제는 다운 스트림 애플리케이션에 OCR 오류의 효과를 평가한다. 떨어져 두 분야를 유지 한 가지 요인은 모음의 문자 수는 픽셀의 수보다 훨씬 작기 때문에 IR 실험 (예를 들어, TREC)는 일반적으로 DIA 실험에 비해 규모 이상의 문서의 주문을 포함한다는 것이다.

DIA 연구 방법 자동 또는 책, 기술 저널, 잡지와 신문을 수동으로 복사의 또 다른 서브 필드. 정보 검색 (IR)가 일반적으로 성립 DIA의 일부, 그리고 그 간주되지 않지만 있지만 오버랩 사이에 "논리"분할 문서를 포함하는, 컨텐츠 추출, 그래픽, 그림 및 텍스트 단어 인식을 기준 링크의 테이블. 반복되는 주제는 영향 평가 OCR 오류 다운 스트림 응용 프로그램입니다. 이 두 분야 별도의 요소는 모음의 문자 수는 훨씬 적은 픽셀 수보다이기 때문에 적외선 실험 (예를 들어, TREC)는 보통, DIA 문서 실험에 비해 규모의 주문을 포함한다는 것이다.

사용되는 컴퓨터 비전 쉽게 조명 및 카메라 위치에 의해 강조 DIA 화상 처리면에서 구별된다. 심지어 휴대폰 카메라는 이제 수백 dpi로뿐만 아니라 많은 장면 이미지에서 읽기 쉬운 텍스트 문서 이미지 캡처를위한 충분한 공간 해상도를 제공하기 때문에 경계가 모호합니다. 결과적인 이미지의 콘트라스트 및 기하학적 왜곡의 보정이 잘 스캔 문서 필요한 것을 넘어서는

과거에는, 컴퓨터 비전, 조명과 카메라 위치에 대한 강조와 함께, DIA의 오픈을 처리하는 이미지를 구별하기 쉽다. 심지어 휴대 전화 카메라는 이제 수백 dpi의 속도, 큰 장면의 이미지에서 텍스트의 명확한 표시에 충분한 공간 해상도, 촬영 문서 이미지를 제공 할 수 있기 때문에 경계가 흐려집니다. 얻어진 화상 콘트라스트 및 스캔 된 문서의 요건을 넘어 멀리 기하학적 왜곡 보정

이 컬렉션은 우리가 통일 DIA의 이론 또는 OCR에서 멀리 아직도 제안합니다. 우리가 의심 가정을 기반으로 추론 또는 알고리즘에 의존하는 것 외에는 선택의 여지가 없기 때문에 핸드북은 더욱 유용하다. 우리가 사용할 수있는 가장 유용한 방법은 모든 발명이 아닌 주요 원칙에서 파생되었다. 시간이 익은 때, 많은 다른 방법이 같은 필요를 채우기 위해 발명된다. 그들은 모두 "가장 좋은 방법"에 대한 확고한 후보 남아있다. 이 핸드북은 상당히을 제시하지만 일반적으로 따기 승자와 패자를 피할 수 있습니다.

우리는 통합 이론, 디아즈, 심지어 OCR에서 멀리 있음을이 컬렉션을 보여줍니다. 우리는 선택의 여지가 있지만, 의심스러운 가정을 기반으로 추론 또는 알고리즘에 의존하기 때문에이 매뉴얼은 더 유용하다. 우리가 사용할 수있는 가장 유용한 방법은 기본 원리 밖으로에서 파생되지, 발명한다. 그리고 때 시간, 다른 방법의 숫자가 같은 요구 사항을 충족하기 위해 고안되었다. 그들은 "모범 사례"회사 후보입니다. 이 매뉴얼은 상당히을 설명하지만, 보통 따기 승자와 패자를 피할 수 있습니다.

"소음"더 나은 결과에 주요 장애물이 될 것으로 보인다. 이 모든 더 자극하기 때문에 소음이 많은 종류 (예 : 스큐, 블리드를 통해, 밑줄) 거의 속도가 느린 인간의 독자 아래로. 우리는 아직 특성화 및 통신 과학이 가지고있는 정도 신호와 노이즈를 정량화에 성공하지 않았습니다. OCR 및 DIA는 정보 전달의 주요 예입니다 만, informationtheoretic 개념은 거의 호출되지 않습니다. 종종 합성 데이터 - - 우리의 회의와 함께 개별 연구 그룹에 의해 조직 경연 대회에서 우리는 경험적 중류 비교를 축적하여 올바른 방향으로 이동하고 있는가?

"소음"더 나은 결과를 달성하기 위해 주요 장애물이 될 것으로 보인다. (예 : 스큐, 출혈, 밑줄 등) 소음의 많은 유형이 거의 인간의 독자 아래로 독자를 느리게하지 않기 때문에 이것은 더 성가신입니다. 우리는 기술 및 통신 과학 같은 신호와 노이즈를 정량화 성공적으로되지 않았습니다. OCR 및 DIA는 정보 전송하지만, 정보 이론의 개념에 대한 몇 가지 참조의 대표적인 사례이지만. 우리는 중류에 비해 경험의 축적을 통해, 올바른 방향으로 이동 - 일반적으로 통합 된 데이터 - 회의에 함께 우리와 함께 각 팀 경주에서 가져온 조직?

하나는이 같은 지방 메에서 팔의 손에 자신의 좋아하는 주제에 대한 어려운 대부분의 정보를 가지고 안심되고 점점 건망증이 점점로 즉,이 수도로합니다. 온라인 리소스가 지난 10 년 동안 개선 한만큼, 나는 페이지의 모서리를 거절 좋아하고 여백에 메모를 낙서. 구식 선형 프레젠테이션에 검색 지시 안구 단속 운동을 선호하는 젊은 사람들은, 온 - 라인 버전을 할 수 있습니다.

사람이 같은 두꺼운 책에서, 더 많은 시간 건망증이 될 때, 손에서 자신이 좋아하는 주제의 가장 어려운 정보가 안심한다. 지난 10 년간 온라인 자원이 크게 개선,하지만 난 여전히 페이지 하단 코너를 선호되었지만, 공간은 여백에 메모를 낙서. 구식 선형 프레 젠 테이션에 비해 젊은 사람들이 지향 눈을 검색하는 것을 선호, 그들은 온라인 버전을 할 수 있습니다.

데이비드 Doermann 칼 Tombre은 매우 잘 계획, 선택, SOLICIT 및 편집이 제요에 자격이되었다. DIA에 대한 그들의 기여는 내가 아는 한, 그들은 사이렌의 노래는 진흙과 DIA의 권선 채널에서 그들을 전환시킨 적이 한 폭 넓은 한번 벤 면적을 커버. 그들의 기술적 인 기여는 물론 장 저자에 의해 참조되고 음성은 각 섹션의 시작 부분에 들립니다.

데이비드 도먼 칼 톰 브래들리 고도의 자격을 갖춘 계획, 선택, 수집이 제요 편집. 지금까지 내가 아는 한, 그들은 콩 코디가 엄청에 기여, 그들은 사이렌 노래가 강 권선 콘 코르 디아의 진흙에서 그들을주의를 분산시키지 않았다. 그들의 기여는 물론, 그들의 목소리는 각 장 캔의 시작 부분에 들었의 기술 참조 섹션입니다.

데이브는 PAMI 컴퓨터 비전과 기계 학습을 향해 방향을 바꾸었다 때 우리의 주력 저널되었다 IJDAR의 공동 창립-편집기입니다. 오래된 홍보 및 고속과 함께, 대량 PRL은 IJDAR 특별한 문제, 설문 조사, 실험 보고서, 새로운 이론의 혼합물로 잘 우리를 역임했다. 심지어 이전, 리엘 로젠 펠드의 격려로, 데이브는 조직과 언어 및 DIA 데이터 세트, 코드, 참고 문헌 및 전문 지식의 중요한 자원이되었다 미디어 프로세싱 실험을 지시했다.

PAMI 스티어링 컴퓨터 비전, 기계 학습, IJDAR 우리의 주력 저널 될 때 데이브는 공동 창립 편집기 IJDAR입니다. 가장 오래된 홍보 및 고속, 고용량 공공 관계로, IJDAR 주제, 조사, 실험 보고서와 이론의 범위와 우리를 제공합니다. 앞서 데이브 구성하고 언어 및 미디어 처리 실험실을 지시 리엘 로젠 펠드의 격려, 주요 자원 DIA 데이터 세트, 코드, 참고 문헌 및 전문 지식이되고있다.

칼, 다른 IJDAR의 공동 설립자, DIA 연구 개발의 세계 최고의 센터 중 하나로서지도에 낸시를 넣어. 지속적인 드라이브와 함께 시작하는 것은, (손으로 그려진 다리 또는 백 년 이상의 수명을 가질 수있는 하수 라인 및 정지 비행 보잉 747의 계획에 대한 도면) 기존의 CAD 형식으로 도면의 변환을 자동화하는 칼 함께 가져 및 DIA의 임계 질량을 형성하기 위해 대학과 INRIA 연구의 지평을 확대했다.

DIA의 연구 및 개발을위한 주요 글로벌 센터의 하나로서 또 다른 IJDAR의 공동 창립자 인 칼 (칼) 낸시. 자동으로 시작되도록 변환 전통적인 형식의 CAD 도면을 촉진하는 것입니다 (여전히 보잉 747 프로그램을 비행하는 동안 다리 또는 하수 도면, 삶의 100 년 이상이있을 수 있습니다 것은 손으로 그린 ​​것입니다), 캘거리 대학과 인도 연구소 연구진은 DIA의 임계 질량을 형성, 자신의 지평을 확장하기 위해 한 자리에 모였습니다.

데이브 칼도 더 함께 우리의 연구 커뮤니티를 가지고 그들의 몫보다는 수행 한 공통 용어와 데이터를 찾을 벤치 마크를 생성하고 예술의 상태를 진행합니다. 이 큰 환자 남성 긴, 항상, 우리의 컨퍼런스에서 수수께끼를 해결할 준비가 익숙한 광경이었다 부재자 세션 의자 또는 스피커에서 누락 된 정보의 조각, 채우기를 제공하거나 서로 알아야 할 사람을 소개했다.

데이브 칼이 더 많은 작업을 수행 한 우리의 연구 커뮤니티는 일반적인 용어와 데이터를 찾을 벤치 마크를 생성하고 기술 수준을 향상하기 위해 함께 모일 것이다. 우리의 회의에서 이러한 환자의 거물이 익숙한 광경이었다, 그들은 누락 된 정보를 제공하거나 회의에서 의장의 대변인의 부재를 채우기 위해, 또는 사람들이 서로를 알아야 소개, 항상 문제를 해결할 준비가되어 있습니다.

국방부 정보국 커뮤니티는 편집자와이시의 적절하고 포괄적 인 수집 ​​저자에 감사 할 모든 이유가있다. 즐길 수, 다음 에디션에 기여하기 위해 최선을 다하고 있습니다!

DIA 커뮤니티는 편집자와 작가의 적절하고 포괄적 인 수집을 감사하기 위해 모든 이유가있다. 즐길 수, 다음 에디션에 기여하기 위해 노력!

 

파트 A 개요, 배경, 기본 ....................
문서 및 쓰기 시스템의 1 A의 간략한 역사 ............. ...... 3

2 문서 작성, 이미지 인식 및 문서 품질 ...... 11 개

세의 진화 문서의 이미지 분석 .................... ........ 63 개

문서 분석에 4 이미징 기술은 처리 ................. 73

부 B 페이지 분석은 ............ ............................................ 133 개
5 페이지 분할 기법 문서 분석 ................ 135 개

문서의 논리적 레이아웃의 6 분석 ....................... .... 177

7 페이지 유사성 및 분류 ........................................ 223

부 C 텍스트 인식 .................................................. ... 255
문서 인식 8 텍스트 분할 .......................... 257

9 언어, 스크립트 및 글꼴 인식 ...... .......................... 291

(10) 기계 인쇄 문자 인식 ................. ............... 331

(11)와 handprinted 문자 및 Word 인식 ........................ 359

12 연속 필기 스크립트 인식 ........................... 391

(13) 중동 문자 인식 ............... .................. 427

14 아시아 문자 인식 ............................................. 459

볼륨이
비 텍스트 정보의 일부 D 처리 ........................ 487 개
15 그래픽 인식 기술 ........... ............................. 489

심볼 인식의 16 개요 .............. ...................... 523 개

(17) 분석 및 그래픽 문서의 해석 ................. (553)

(18) 로고 상표 인식 ....................................... 591

표 및 양식의 19 인식 . ......... 647

20 가공 수학 표기법 ...... ................................. 679

파트 E 응용 프로그램 ............................................... ........... (703 개)
우편 응용 프로그램에서 21 문서 분석 및 확인
처리를 ............................. ...................................... (705 개)

(22 개) 분석 및 악보의 인식 .... .......................... 749

23 분석 문서의 출생 디지털 ................. .................... 775

24 이미지 기반 검색 및 문서에서 키워드이 보인다 ........ 805

이미지 및 비디오 25 텍스트 현지화 및 인식 .. ............ 843 개

온라인 데이터의 일부 F 분석 ............................... ............. 885
26 온라인 필기 인식 ......................................... 887

27 온라인 서명 검증 ............................................. 917

28 스케치 인터페이스 . .................................................. .... 949

부 G 평가 및 벤치마킹 .................................. 981 개
29 데이터 집합 및 주석에 대한 문서 분석
및 인식 .............................................. .............. 983 개

(30) 도구 및 문서 분석 시스템 평가를위한 지표 ....... 1011

색인 ................. .................................................. ...... 1037






추천

출처www.cnblogs.com/2008nmj/p/12185468.html