Apache PDFBox

소프트웨어 스크린 샷:
Apache PDFBox
소프트웨어 정보:
버전: 2.0.0 업데이트
업로드 날짜: 9 Apr 16
개발자: Ben Litchfield
라이센스: 무료
인기: 145

Rating: nan/5 (Total Votes: 0)

이 프로젝트는 Java 응용 프로그램 내에서 PDF 문서의 모든 구성 요소에 액세스 할 수 있습니다.

FontBox 및 JempBox도 다운로드 할 수 있습니다

이 릴리스의 새로운 기능입니다 무엇 : 있습니다.

OverlayPDF 로직 라이브러리 클래​​스로 이동해야합니다
이 RegisSTAR 문서로드 문서 오류
TestFilters는 비 결정적이다
PDFCloneUtility는 COSStreamArray을 처리하지 않습니다
RubberStampWithImage 더 많은 이미지 형식을 지원해야
페도라 포장 1.8에서 TestImageIOUtils은 선택 사항 확인
CCITTFactory에서 다중 TIFFs에 대한 지원, tiff2pdf을 수행 할 수있는 PDFBox한다
제목에 추가 PDFBox 버전
그렇지 않은 경우 COSDocument 및 PDDocument 선언 IOException가 슬로우
RandomAccessFileOutputStream에 대한 추가 단위 테스트

이 버전 1.8.9의 새로운 기능입니다 :

이 OverlayPDF 로직 라이브러리 클래​​스로 이동해야합니다
이 RegisSTAR 문서로드 문서 오류
TestFilters는 비 결정적이다
PDFCloneUtility는 COSStreamArray을 처리하지 않습니다
RubberStampWithImage 더 많은 이미지 형식을 지원해야
페도라 포장 1.8에서 TestImageIOUtils은 선택 사항 확인
CCITTFactory에서 다중 TIFFs에 대한 지원, tiff2pdf을 수행 할 수있는 PDFBox한다
제목에 추가 PDFBox 버전
그렇지 않은 경우 COSDocument 및 PDDocument 선언 IOException가 슬로우
RandomAccessFileOutputStream에 대한 추가 단위 테스트

이 버전 1.8.8의 새로운 기능입니다 :

이 OverlayPDF 로직 라이브러리 클래​​스로 이동해야합니다
이 RegisSTAR 문서로드 문서 오류
TestFilters는 비 결정적이다
PDFCloneUtility는 COSStreamArray을 처리하지 않습니다
RubberStampWithImage 더 많은 이미지 형식을 지원해야
페도라 포장 1.8에서 TestImageIOUtils은 선택 사항 확인
CCITTFactory에서 다중 TIFFs에 대한 지원, tiff2pdf을 수행 할 수있는 PDFBox한다
제목에 추가 PDFBox 버전
그렇지 않은 경우 COSDocument 및 PDDocument 선언 IOException가 슬로우
RandomAccessFileOutputStream에 대한 추가 단위 테스트

이 버그 수정 :

이 버전 1.8.1의 새로운 기능입니다 :
PDGraphicsState 클래스는 NPE로 이어지는 널 페이지 인수를 수신
이미지에 표시되지 주석의 내용 (PDF 변환)
TextPosition.getX ()와 getY () ()는 CropBox 제대로 작동하지 않습니다
TTFSubFont는 일부 프린터를 나사 버그가 발생하기 쉬운 TTF 서브 글꼴을 생성
상호 작용 형태의 PDF 파일을 병합하면 손상된 PDF 결과
XFA 양식을 포함하는 문서를 저장하면 잘못된 PDF를 생성
NonSequentialPDFParser 잘못 문서 정보를 분석
사용하지 않는 PDSignature 클래스는 제거해야
고정 폭 글꼴을 사용할 때 오류

이 버전 1.7.1의 새로운 기능입니다 :

이 예외를 확장 / 더 표준 줄로 예외 더 나은 출력을 랩 예외를 전달하는 랩 예외 변경
그들은 외부 참조 테이블 / 스트림에서 참조하는 경우에만 객체 스트림을 구문 분석
길이 값이 잘못된 경우 BaseParser의 스트림 구문 분석 주사로 후퇴한다
RandomAccessBuffer의 메모리 소비를 줄입니다

이 버전 1.7.0의 새로운 기능 :

이 CJK 디코딩
PDFBox에서 PDF / A 검사기의 통합
유형 4의 기능을 구현 (PDFunctionType4)
DeviceN 색 공간을 사용 PDJpegs의 색상 변환
추가 & quot; 이미지 바와 같이 저장; PDFReader에
PDFParser의 서브 클래 싱 허용
PDF를 분할 할 때 추가 지원은 시작 및 / 또는 끝 페이지를 설정하는 방법
CID-타입 2 글꼴 지원 CIDToGIDMap
분할 PDFont 번호 인코딩

이 개선 :

이 버전 1.6.0의 새로운 기능입니다 :
PDF 서명 인터페이스 개선
PDF에서 B / w 이미지를 추출 할 수 없습니다
필요한 경우에만 Type1C 글꼴 메트릭 만들기
PS XObjects 건너 뛰기 대신 예외를 던지고
ExtractText에 옵션 디버그 출력 추가
RandomAccessBuffer에서 제로와 불필요한 채우는 새로운 배열 :: 쓰기 (바이트 [], int, int)를
불필요한 FlateFilter에 OutputStream에 지정된 바이트 배열에서 복사 중간이 InputStream를 사용하여 :: 디코딩
ImageIO에서 종속성을 제거 (이었다 PDPage convertToImage 버그 흑백 PDF 파일에서 흰색 이미지를 생성합니다.)
서명 개선 (설정 가능한 서명 크기)
PDF 버전은 문서 카탈로그에 읽을 수 없습니다
PDFBox 기능에 대한 단위 테스트
버그 수정:
회전 된 이미지는 배치 이미지를 PDF 페이지를 변환하는 동안 제대로 렌더링되지 않습니다
CLONE -convertToImage 색상을 반전 보인다
이미지로 변환 빈 이미지를 만듭니다
PDF 2 티파니 변환이 제대로 발생하지 않습니다
RandomAccessBuffer는 단일 바이트 읽기에 대한 패치가 부착 된 잘못된 값을 반환

이 개선 :

이 버전 1.5.0의 새로운 기능입니다 :
PDFDocument.save 정말 느리다
던지는없이 비 순응 PDF를 (첨부) 읽기 ...
손상된 PDF 파일을 읽을 때 추가 NPE 보호 발생한
PDJpeg에 임시 파일을 사용하지 마십시오
모든 PDF 크기 기본적으로 파일을 temporty 사용하지 마십시오
버그 수정:
텍스트 추출에 오류 : java.lang.IndexOutOfBoundsExceptio
PDFTextStripper 일부 일본어를 처리하지
PDPageNode.getCount에서 NPE NullPointerException이
CFFParser.readCharset java.lang.IllegalArgumentException가
Type1C 글꼴을 만들지 못했습니다. 타입 1 글꼴로 다시 하락
PDFont 글꼴 파일을 닫을 수 없습니다.
PDPageNode에서 NPE
PDFStreamEngine.processEncodedText는 UTF-16 텍스트 실패
ExtractText 중국 PDF,하지만 pdfbox는, 한국을 구별 ...
PDFBox 1.4로 추출 텍스트가 아닌
PDFBox 1.4 사용하여 잘못된 추출 된 텍스트
분실 공백 경우 아랍어 텍스트를 추출
일본어 문자를 추출하면 쓰레기를 제공합니다
화질 개선
PDFBOX은 플랫폼 이서 인코딩에 의존하지 않을 수 있습니다
RandomAccessBuffer가 비어 만들 수 갈까요
ExtractText 정크를 반환
클래스 PDField의의 getParent 방법은 모두를 고려하지 않습니다 ...
텍스트 추출은 느리고을 / tmp는 AWT 글꼴 파일을 upwith 채 웁니다
널 포인터 주석이 하위 유형이 없습니다 예외

이 새로운 기능 :

이 버전 1.3.1의 새로운 기능입니다 :
유니 코드 매핑 CID
FontFile3에서 인코딩을 찾기 - CompactFont 형식
쉽게 PDF에서 페이지 범위를 추출 유틸리티 클래스 추가
PDFToImage : 내보낼 영역을 선택 할 수있는 기능을 추가 ...
독립 실행 형 응용 프로그램에 WriteDecodedDoc 추가
개량:
어도비에서 Addtional CMAP 파일
JPXDecode 필터를 통해 JPEG2000 이미지를 처리
수용 해주세요 '-'의 숫자가 예상되는 곳
트루 타입 글꼴에 대한 추가 CMAP 형식의 구현
는 PD 모델 메타 키에 액세스
업데이트 / 사용의 JUnit 버전을 조절
업데이트 / 개미 빌드를 활성화
스트림으로부터 객체는 이미 읽을 개체를 덮어 ..
사양 PDF 파일 중 더 나은 핸들
AcroForms와 오류를 무시하는 기능 추가
PDPixelMap 너무 장황
더 나은 파일의 끝에 %%의 EOF 플래그를 누락 / 손상 처리
endstream 사이 erronous 데이터를 처리 개선 ...
텍스트 만 사업자에서 PageDrawer에 종속성을 제거
FlateDecode와 지원 TIFF 예측 (2), 패치 포함
ColorSpaceCMYK.toRGB의 성능을 향상, 패치 부착
버그 수정:
텍스트 추출 문제는 폴란드어 문서를 형성한다.
인덱스 컬러 이미지는 암호화 후 잘못된 색상을 가지고
텍스트 추출의 예외
PDFMergerUtility는 고유하지 않은 AcroForm 필드 이름을 만들 수 있습니다
Somtimes, TextPosition 잘못된 값이 ..
트윈 쌍을 추출 할 때 텍스트 추출은 1 문자를 제거합니다
회귀 테스트에서 Exolab.pdf 잘못된 텍스트
잘못된 텍스트의 글꼴에 따라 생산 ...
PDFBox는 jstor.org에서 PDF 문서를 구문 분석 할 수 없습니다
리눅스와 맥 OS X에 testextract 실패
PDF 파일을 인쇄하는 라인이 겹쳐 마지막 문자
잘못된 텍스트 렌더링 PDF를 인쇄하는 동안
PDDocumentInformation의 재 설정 충전 특성은 할 ...
fontmanager.so/fontmanager.dll에서 EXCEPTION_ACCESS_VIOLATION
SetValue를의 PDChoiceField의 ​​구현이 작동하지 않습니다 ...
CMAP 파서는 더블 바이트 매핑이 작동하지 않습니다 ...
PrintPDF는 Windows 기본 프린터를 고려하지 않습니다 ...
텍스트 추출에 의한 오류
MS 워드가 실패에서 PDF에서 텍스트를 추출 생성
(PDDocument 부하에서 무시 파일 파일 scratchfile ...
CJK 문서의 Extratced ASCII 텍스트 형식이 잘못되었습니다
PDTrueTypeFont.loadTTF는 () (TTFDataStream.java:195에서) 정지
로마 페이지 번호를 추출의 문제점을 해결하기 PDPageLabels.java]
ClassCastException이 : COSInteger는 COSDictionary로 캐스팅 할 수 없습니다
PDFont.getEncodingManager는 스레드로부터 안전하지 않습니다; FIX 포함
FlateDecode, 패치 PNG의 예측 인자의 잘못된 취급 ...
인덱스 색상 공간 이미지에 대한 잘못된 불투명
공간 퀘스 트 로그에서 사라질와 텍스트는 왼쪽으로 이동
를 사용해 IIOException : 오류 2 CCITT가 포함 된 PDF를 표시 ...
Write2File는 PDCalRGB에 대한 실패
사용 COSName 상수 대신 COSString
움라우트 글꼴 크기 계산 문제
[pdfbox-앱] 받는다는 번들 구성 문제
문서 : 눈에 띄는 예는 오래된 클래스 이름을 가지고
AFM-파일이로드되지 않습니다
TextExtraction 텍스트의 경우 혼합
PageDrawer는 계정에 전체 CropBox을지지 않습니다
표준 14 글꼴 표준 인코딩을 정의
PDF를 암호화 할 때 인덱스 이미지는 때로는 손상
텍스트 추출 시험에서 OutOfMemoryError를

유사한 소프트웨어

YQL Geo Library
YQL Geo Library

5 Jun 15

DynCSS
DynCSS

13 Apr 15

Apache Commons CSV
Apache Commons CSV

10 Dec 15

Json.NET
Json.NET

20 Jul 15

코멘트 Apache PDFBox

댓글을 찾을 수 없습니다
코멘트를 추가
이미지를 켜십시오!
카테고리별로 검색