ByteScout PDF Extractor SDK

소프트웨어 스크린 샷:
ByteScout PDF Extractor SDK
소프트웨어 정보:
버전: 9.0.0.3079 업데이트
업로드 날짜: 15 Aug 18
개발자: ByteScout
라이센스: 셰어웨어
가격: 10.00 $
인기: 193
크기: 596 Kb

Rating: 3.3/5 (Total Votes: 4)


        Windows 소프트웨어 개발자를위한 PDF Extractor SDK : PDF to Text, PDF to XML, PDF의 이미지, PDF 정보 읽기, PDF for CSV for Excel.

Bytescout PDF 추출기 SDK는 텍스트, PDF, XML, PDF, CSV로 PDF로 변환, PDF에서 이미지 추출, 추가 소프트웨어 없이도 .NET 및 ActiveX 인터페이스에서 PDF 파일에 대한 정보를 추출 할 수 있습니다.


은혜:
 PDF를 일반 텍스트로 변환합니다 (PDF 형식의 신문을 변환하는 경우 열을 따라갈 수 있음) - 보이지 않는 텍스트 추출 포함.
 주어진 사각형에서 셀을 읽어 PDF의 표를 Excel (CSV)로 변환합니다.
 PDF의 테이블을 XML 파일로 변환합니다.
 PDF 파일 메타 데이터 (제목, 저자, 설명)를 추출하고 파일에 대한 다른 정보를 얻습니다 (페이지 수, 암호화 여부).
 PDF 문서에서 임베디드 이미지를 추출합니다 (ASP.NET, VB.NET, C #, VB6 및 VBScript에서).
 DocumentMerger 및 DocumentSplitter 인터페이스 및 클래스를 사용하여 PDF 문서를 병합하고 분할 할 수 있습니다.
Adobe Reader 또는 기타 PDF 판독기 소프트웨어를 설치하지 않아도됩니다.
 .NET 및 ActiveX 인터페이스를 제공합니다.
 100 % 관리되는 C # 코드로 만들었습니다.
    

이번 출시의 새로운 기능 :

버전 9.0.0.3079 : 추출 된 내용을 글꼴 이름, 글꼴 크기 및 색상별로 필터링을 추가했습니다.
OCR 엔진을 최신 버전으로 업데이트했습니다. 'tessdata'폴더에서 언어 파일을 업데이트하십시오.
향상된 텍스트 추출, 표 형식 데이터의 행 그룹화, 성능, XFA 양식 추출, TableDetector, 고정 PDF 구문 분석 문제.

버전 8.7.0.2980의 새로운 기능 :

글꼴 이름, 글꼴 크기 및 색상별로 내용을 표시합니다.
OCR 엔진을 최신 버전으로 업데이트했습니다. 'tessdata'폴더에서 언어 파일을 업데이트하십시오.
향상된 텍스트 추출, 표 형식의 데이터 그룹화, 성능, XFA 양식 추출, TableDetector, 고정 PDF 구문 분석 문제.

버전 8.6.0.2911의 새로운 기능 :

글꼴 이름, 글꼴 크기 및 색상별로 내용을 표시합니다.
OCR 엔진을 최신 버전으로 업데이트했습니다. 'tessdata'폴더에서 언어 파일을 업데이트하십시오.
향상된 텍스트 추출, 표 형식 데이터의 행 그룹화, 성능, XFA 양식 추출, TableDetector, 고정 PDF 구문 분석 문제.

버전 8.2.0.2699의 새로운 기능 :

버전 8.2.0.2699 불특정 업데이트, 개선 사항 또는 버그 수정이 포함될 수 있습니다.

버전 8.0.0.2528의 새로운 기능 :

글꼴 이름, 글꼴 크기 및 색상별로 압축 된 콘텐츠 필터링 기능이 추가되었습니다.
OCR 엔진을 최신 버전으로 업데이트했습니다. "tessdata"폴더의 언어 파일을 갱신하십시오.
향상된 텍스트 추출.
표 형식 데이터의 향상된 선 그룹.
향상된 성능.
향상된 XFA 양식 추출.
향상된 TableDetector.
PDF 구문 분석 문제가 수정되었습니다.
고정 JBIG 이미지 디코딩.
ImageExtractor : 고정 페이지 당 이미지 추출
MultimediaExtractor : 임베디드 MPEG 오디오에 대한 고정 추출입니다.
TextExtractor : 작동하지 않는 RemoveHyphenation 속성이 수정되었습니다.
기타 사소한 개선 및 버그 수정.

버전 7.0.0.2474의 새로운 기능 :

버전 7.0.0.2474 :

PDF 문서를 자동으로 인쇄 할 수있는 새로운 DocumentPrinter 유틸리티 클래스 추가 (사용자 대화 상자 없음)
새로운 JSONExtractor 클래스 추가
생성 된 파일의 출력 폴더를 지정할 수 있도록 DocumentSplitter.Split () 메서드에 대한 재정의를 추가했습니다.
DocumentSplitter에서 멀티 스레딩 버그 수정
tableDetector는 이제 SetExtractionArea () 메소드에 의해 설정된 추출 영역을 존중합니다.
추출 클래스의 새 속성 : ExtractionColumns - 검색된 열의 좌표를 포함합니다. CustomExtractionColumns - 열 감지를 무시할 수 있습니다.
GetPageRect * 메서드는 페이지 회전을 고려하지 않았습니다.
이전 설치의 일부 파일이 업데이트를 방해하는 설치 프로그램의 버그 수정
등록 검사를 수정했습니다. 이제 라이브러리는 예외를 throw하지 않지만 RegistrationName과 RegistrationKey를 잘못 입력하거나 입력 한 경우 데모 모드로 작업합니다.
PDF Multitool : "PDF 문서 열기"버튼에 최근 문서 목록 추가
PDF Multitool : 선택 크기 조정 가능
PDF Multitool : Extract JSON 기능 추가
PDF Multitool : 향상된 표 감지기 UI

PDF Multitool : 향상된 글꼴 렌더링 품질
PDF Multitool : 감지 된 열을 현재 페이지에 표시하기 위해 상황에 맞는 메뉴에 "감지 된 추출 열 표시"디버그 옵션이 추가되었습니다. 현재 표시된 페이지에 대해 추출을 실행 한 후에 만 ​​표시됩니다.
PDF Multitool : 32 비트 Windows에서 고정 글꼴 렌더링 문제
기타 사소한 개선 및 버그 수정

버전 6.30.0.2421의 새로운 기능 :

버전 6.30.0.2421 :

두 PDF 문서의 텍스트를 비교하고 보고서를 생성 할 수 있도록 TextComparer 유틸리티 클래스 (.NET 4.0 어셈블리에서만 사용 가능)가 추가되었습니다.
ICC 색상 프로파일 지원 향상.
임베디드 글꼴 처리가 완료되었습니다.
향상된 AttachmentExtractor입니다.
XMLExtractor.SaveXMLToStream () 메서드가 수정되었습니다.
OCRCacheMode.WholePage 옵션을 사용할 때 추출 된 텍스트 중복을 수정했습니다.
기타 버그 수정 및 개선.

버전 6.20.2354의 새로운 기능 :

버전 6.20.2354 :

PDF를 텍스트로, PDF를 CSV로, PDF를 XML 기능으로 개선
새로운 비디오 추출, 오디오 예제 추출
CSV 및 XML 추출기로 빈 열이있는 테이블에 대한 지원 향상
PDF에서 비디오 및 오디오를 추출하는 새로운 MultimediaExtractor
새 속성 PageDataCaching
새로운 "MemoryCareProcessingOfHugeFiles"예제
이미 삭제 된 페이지를 처리하려고 할 때 null 예외가 수정되었습니다.
XLSExtractor : 글꼴 지원 향상
이제 SkipInvisibleText에서 잘린 텍스트를 건너 뜁니다 (보이지 않음).
텍스트 출력 렌더링 개선
XFDF Extractor : 체크 박스 지원 추가
더 많은 하위 형식을 지원하도록 이미지 출력이 향상되었습니다.
유니 코드 텍스트 처리 개선

버전 6.11.2149의 새로운 기능 :

버전 6.11.2149 :

일괄 처리 샘플이 Reset () 메서드의 사용법을 보여주기 위해 업데이트되었습니다.
페이지 추출을 위해 C ++ 소스 코드 샘플 추가
DocumentMerger는 Merge2 (inputfile1, inputfile2, outputfile) 메서드를 추가하여 두 파일을 병합합니다.
XLS 추출기 사소한 버그 수정
PDF Multitool은 텍스트, 이미지, 벡터 레이어를 활성화 / 비활성화하고, 텍스트 추출을위한 고급 설정을 추가합니다.
XML, CSV, 표 추출은 열 내부에 emtpry 셀이있는 표에 대한 지원을 향상시킵니다.
.ExtractShadowLikeText 속성이 향상되었습니다. 그림자 같은 텍스트를 더 잘 필터링합니다.

6.10.2136 버전의 새로운 기능 :

버전 6.10.2136 :

PDF를 XML로, PDF를 CSV로, PDF로 텍스트로 기능 향상
PDF To XLS 명령 줄 샘플 추가 (vbscript 기반)
PDF To HTML SDK는 새로운 .DetectHyperLinks 속성 (기본적으로 TRUE)을 추가하여 텍스트에서 자동 링크 감지를 활성화 / 비활성화합니다
PDF를 검색 가능한 PDF 파일로 변환하는 새로운 SearchablePDFMaker (PRO 라이센스 용)
추출기의 새 속성 : CFG 파일의 ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders
헤더 열 감지 (AutoAlighHeaderToColumns = true 일 때) 개선됨
.DetectLinesInsteadOfParagraphs를 new .LineGroupingMode로 바꾸어 라인이 단락으로 병합되는 방식을 제어합니다.
중대한! PDF To XML은 텍스트 객체의 잘못된 Y 좌표와 함께 오랜 시간 문제를 수정합니다 (왼쪽 상단 대신 왼쪽 하단을 가리 킵니다)
.TableXMinIntersectionRequiredInPercents 및 .TableYMinIntersectionRequiredInPercents 속성이 추가되었습니다.
C ++ 소스 코드 샘플 추가
XML 추출기가 PreserveFormatting = true 모드에서 누락 된 빈 열을 수정합니다.
일부 PDF 파일의 색상이 약간 수정되었습니다.
여러 개의 OCR 언어 지원 추가

PDF Multitool GUI : TXT, CSV, XML 및 래스터 렌더러 대화 상자에 클립 보드에 복사 버튼 추가
XLSExtractor : PageToWorksheet 속성을 추가하여 페이지 당 별도의 워크 시트 생성을 활성화 / 비활성화합니다.
새로운. TextEncodingCodePage 속성
PDFViewerControl : ValidateContextMenu를 추가하여 사용자가 컨텍스트 메뉴에 사용자 정의 항목을 추가 할 수 있도록합니다.
PDF 뷰어 컨트롤 : 속성 추가 ShowTextObjects, ShowImageObjects, ShowVectorObjects
XMLExtractor는 이제 인식 된 텍스트에 "OCRConfidence"속성을 추가합니다.
PDF / A 검사 기능 (베타)
원래 레이아웃에 따라 컨트롤 및 텍스트 검사 및 정렬을 향상시킵니다. 문제는 구문 분석하는 동안 컨트롤에서 Y 좌표가 이동하여 발생했습니다. 올바른 방법은 이동하는 것입니다 ...
XML 추출기가 업데이트되었습니다 : 이제 확인란 및 텍스트 필드에 CONTROL 태그가 생성됩니다.
현재 디렉토리를 사용하여 임시 디렉토리로 변경
확인란, 라디오 박스, 편집 상자, 콤보 박스가 더 잘 지원됩니다.
부분 신탁 발신자 허용

5.80.1781 버전의 새로운 기능 :

버전 5.80.1781 :

PDF to XML, PDF to CSV, PDF to Text 기능 업데이트
OCRMode는 이제 9 가지 모드를 제공합니다.
.DetectLineInsteadOfParagraph가 이제는 더 잘 작동합니다. 표 셀에 여러 줄 문자를 캡처하려면 False로 설정하십시오!
향상된 PDF 컨트롤 지원
FDF 및 XFDF 데이터 추출

버전 5.10.1747의 새로운 기능 :

버전 5.10.1747 :

PDF to XML, PDF to CSV, PDF to Text 기능 개선
이제 텍스트 컨트롤에서 텍스트 추출을 지원합니다.
XML 추출기는 이제 글꼴 스타일, 크기, 이름, 텍스트 좌표를 태그에 추가합니다.
OCR 사용을위한 ASP.NET 샘플이 추가되었습니다.
"tessdata"폴더의 위치를 ​​지정하는 새로운 속성 OCRLanguageDataFolder
향상된 PDF 파일 지원
회전 텍스트 지원 향상
업데이트 된 소스 코드 샘플
업데이트 된 문서
사소한 개선 및 수정

버전 5.00.1626의 새로운 기능 :

버전 5.00.1626 :

OCR (이미지에서 텍스트) 기능 추가 : 이제 임베디드 이미지에서 텍스트를 추출하고 손상된 텍스트를 복구 할 수 있습니다
일부 설정으로 마지막 열이 누락 된 CSV 및 XML 추출기로 해결 된 문제
손상된 PDF 파일에 대한 향상된 지원
단어 일치 모드가있는 여러 줄 문자 검색 텍스트 검색이 지원됩니다.
하이픈과 다른 행으로 텍스트를 검색 할 수 있습니다. 새 소스 코드 샘플보기 하이픈으로 텍스트 찾기
RTL 언어 자동 감지를위한 새로운 속성 .RTLTextAutoDetectionEnabled (기본값은 false)
PDF 뷰어 GUI 데모 개선
사소한 개선 및 수정

요구 사항 :

.NET Framework 2.0 이상

제한 사항 :

지원되는 운영 시스템

유사한 소프트웨어

TWebPost
TWebPost

28 May 15

exe4j
exe4j

26 Jan 15

개발자의 기타 소프트웨어 ByteScout

코멘트 ByteScout PDF Extractor SDK

댓글을 찾을 수 없습니다
코멘트를 추가
이미지를 켜십시오!