PdfParser는에 설계되었습니다 glanceIt에서 files.Features PDF (PDF 형식)에서 데이터를 추출하기위한 여러 가지 유틸리티로 구성되어 오픈 소스, 휴대용, 무료, 플랫폼 독립적 인 웹 기반 및 독립 실행 형 라이브러리 소프트웨어 이로드 헤더와 개체를 구문 분석 할 수있는 방법은 압축 된 PDF 문서뿐만 아니라, 주문 페이지에서 추출 텍스트를, 메타 데이터 정보 (설명, 저자 또는 키워드)를 추출 지원합니다.
또한, 소프트웨어는, 다양한 캐릭터 세트 인코딩 (맥 OS 로마 및 Windows 안시)를 지원 그것은 완전히 PSR-0 및 PSR-1 표준을 준수하고, 작곡가와 호환됩니다. 또한, 텍스트 섹션 진수 헥사 콘텐츠 인코딩을 처리 할 수있다.
불행하게도, 그 순간에, PdfParser 라이브러리 소프트웨어는 보안 PDF 문서를 지원하지 않습니다. 당신은 암호화 또는 암호로 보호 된 PDF 파일을 구문 분석하려는 경우 따라서, 당신은 원 및 다른 URL,이 software.Getting가 PdfParserThe PdfParser 소프트웨어가 웹 서버의 상단에서 실행되도록 설계되었습니다 시작으로 t은 그렇게 할 수. 그것은 및 다른 URL, SA의 PHP 라이브러리, 그것은 PHP 5.3 이상이 있어야 서버에 설치 있도록. 이 TCPDF 파서 라이브러리 소프트웨어에서 파생됩니다.
패키지가 자동으로 작곡가 명령 줄 프로그램을 사용하여 서버에서 다운로드 할 수 PdfParser을 설치하는 것은 매우 쉬운 일이다. 따라서, 먼저 & lsquo 당신의 composer.json 파일에 소프트웨어를 추가 한 후 사용해야합니다; 작곡가 업데이트 smalot / pdfparser 및 다른 URL; 다운로드 명령.
언급 한 바와 같이, PdfParser는 독립 라이브러리로 배포 할 수 있습니다. 이를 위해, 당신은 GitHub의에서 자사의 소스 코드를 잡아해야하며, 다음 & lsquo을 실행, 작곡가 업데이트 및 다른 URL을; 명령은 자동으로 종속성을 다운로드하고 autoload.php 파일을 생성합니다. 자세한 내용은 프로젝트 및 다른 URL에서 확인할 수 있습니다; 웹 사이트 후드 .Under (아래 링크 참조) PdfParser의 후드 운영 systemsLooking를 지원, 우리는 프로그램이 PHP 서버 측 프로그래밍 언어로 작성된 것을 알 수 있습니다. 이것은 32 비트와 64 비트 명령어 세트 두 아키텍처를 지원하는 모든 운영 체제에서 사용할 수있는 것을 의미한다
이 릴리스의 새로운 기능 무엇 :.
이 병합 끌어 오기 요청 #을 scotam 41 / 문제-33
글꼴로 반환 개체 클래스에 대한 수정
이 버전 0.9.20의 새로운 기능 :
이 버전은 (글꼴, 보안 파일 등)을 구문 분석에 몇 가지 버그를 해결합니다.
TCPDF 종속성을 업데이트해야합니다.
이 버전 0.9.19의 새로운 기능 :
이 누락 된 글꼴 경우이 버전의 고정 XObject에 텍스트 추출 및 추가 텍스트 대체.
이 요구 사항 :
PHP
댓글을 찾을 수 없습니다