광학 문자 인식 (OCR)는 ASCII와 같은 문자 코드로 인쇄 또는 서면 텍스트 문자의 광학 스캔 비트 맵의 번역이다. 이 편집되고, 그렇지 않으면 컴퓨터를 조작 할 수있는 데이터 파일로 하드 카피 물질을 설정하는 효율적인 방법이다. 이 긴 전자적으로 긴 문서를 신속하게 사용할 수 있도록 라이브러리 및 정부 기관에서 사용하는 기술입니다. OCR 기술의 발전은 기업이 그 사용이 증가를 가했다. 많은 문서 입력 작업의 경우, OCR 가장 비용 효과적이고 빠른 방법을 사용할 수 있습니다. 그리고 매년,이 기술은 한 번 파일 캐비닛 및 종이 문서의 전체 상자에 넘겨 저장 공간의 에이커를 해제합니다. OCR 사용하기 전에, 원료는 비트 맵 (도트 패턴)와 같은 페이지에 읽어 (때로는 PC에 특화된 회로 기판) 광 스캐너를 사용하여 스캔한다. 이미지를 인식하는 소프트웨어도 필요합니다.
우리의 소프트웨어 패키지는 절연 필기 문자 및 신경망 우지 펜 문자 데이터 세트의 분류의 자릿수를 해결하는 것을 제안한다. 데이터는 태블릿 PC에 (11) 작가에 의해 쓰여진 26 자와 10 자리의 샘플로 구성되어 있습니다. (표준 UNIPEN 형식) 문자는 대문자와 소문자를 모두 작성하고 작가 당 문자의 전체 두 세트가있다. 따라서 출력 (35) 클래스 중 하나이어야한다. 궁극적 인 목적은 각 문자에 대한 작가 독립적 인 모델을 구축하고있다.
유용한 기능의 선택은 따라서, 기능의 새로운 의미 세트 문자 인식에 매우 중요하다, C. Agell에 의해 도입 된 통일 차동 정규화 좌표 (UDNC)를 채택하고있다. 이러한 기능은 신경망을 훈련 우지 펜 문자 데이터 세트에 대한 성능을 테스트하는 데 사용되도록 간단한 분류 알고리즘을 사용하여 인식률을 향상시키기 위해 표시됩니다.
인덱스 조건 :. matlab에, 소스 코드, OCR, 광학 문자 인식 스캔, 텍스트, 텍스트를 작성, ASCII, 격리 된 문자
이 요구 사항 :
이 matlab에
댓글을 찾을 수 없습니다