CLI와 루비 라이브러리를 모두 들고 보석으로도 가능
이 특징 : 있습니다.
검색 가능한 UTF-8 일반 텍스트
어떤 형식의 페이지 이미지 나 미리보기
PDF 파일
단일 페이지
문서 메타 데이터 (제목, 저자, 페이지 수 ...)
이 릴리스의 새로운 기능입니다 : 리브레 오피스 지원을위한
버그 수정.
이 버전 0.6.4의 새로운 기능 :
이 Docsplit의 커맨드를위한 언어 플래그를 추가했습니다.
된 몇 가지 버그를 수정했습니다.
pdftk의 사용 중단을위한 준비.
이 버전 0.6.0의 새로운 기능 :
이 Docsplit가 올바르게 자신의 파일 이름에 임의의 문자가 포함 된 문서를 포격 처리해야합니다.
--density 옵션은 문서의 이미지를 생성 할 때 래스터의 해상도를 특정 하였다.
OCR에 대한 이미지 해상도는 200에서 400 DPI 두 배되었습니다 -이 정상 문서에 대한 눈에 띄는 차이를 만들 것이 아니라, 글씨에 대한 또 다른 세계를 만들 것입니다.
Docsplit 지금 OCR 전에 GraphicsMagick의 --despeckle을 사용합니다.
이 어떤 버전 0.5.2의 새로운 기능 :
PDF에 투명하게 변환의 경우, 파일 형식이 GraphicsMagick가 읽을 수 한 때 Docsplit이 오픈 오피스를 통해 GraphicsMagick을 선호 만든 ( PNG, GIF는, 도트 JPG, JPEG는, TIF는, TIFF는, BMP는, PNM은, PPM은 SVG는) 주당 순이익.
댓글을 찾을 수 없습니다