cpdetector 프로젝트는 코드 페이지 검출을위한 작지만 영리한 프레임 워크입니다.
cpdetector는 다른 전략을 통합 코드 페이지 검출을위한 작지만 영리한 프레임 워크입니다. 이것은 네트워크를 통해 텍스트 데이터를 액세스 타사 소프트웨어 라이브러리로서 사용될 수있다.
또한 정렬 및 코드 페이지를 기반으로 방대한 문서를 변환 할 수있는 명령 줄 도구의 형태의 모범 사례 구현이 포함되어 있습니다.
사용 가능한 전략은 다음과 같습니다 : XML 인코딩 선언의 jchardet (배제, 주파수 분석, 추측), HTML 캐릭터 세트 속성의 감지, 감지.
코드 페이지는 무엇입니까?
먼저, 텍스트 문서 비트의 시퀀스에 불과하다. 그는 컴퓨터 (번호와 같은 컴퓨터에 의해 식별된다) 문자의 형태로이 데이터를 표시 할 수있는 방법을 결정한다.
코드 페이지 - 또한 charset 인코딩으로 알려져있다 - 문자 텍스트 문서의 원시 데이터를 매핑합니다. 예를 들어 원래 ASCII 코드 페이지는 128 다른 문자를 매핑 할 수 있도록하여 표시되는 문자를 결정하는 옥텟 (바이트)의 7 비트를 사용합니다. 과거 메모리에서 비싼과 컴퓨터는 대부분 단지 8 비트에 대한 레지스터와 버스를했다.
메인 프레임 잉태되었을 때 그것은 지원해야하는 문자, 결정했다. 예를 들어 의사와 수학자 방정식 특수 문자를 필요로했다. 그 결과, 컴퓨터는 종종 특별한 코드 페이지와 함께 제공
이 릴리스의 새로운 것은 :.
이 주요 버그 수정 버전은 명령 줄 배치 모드의 두 가지 문제를 해결합니다.
이 스위치는 발견되지 않은 문서를 이동하는 지금 다시 작동 건너 뜁니다.
어떠한 시도도 (후자는 뛰어난 프로그램의 흐름을 발생) 발견되지 않은 문서를 트랜스 코딩이 작성되지 않습니다.
이 버전 1.0.8의 새로운 기능 :
이 릴리스는 안정성 자료이며, 오픈 JDK와 바이트 순서 표시 탐지 및 호환성 문제를 해결합니다. 또한 지금 자바 1.5이 필요합니다.
댓글을 찾을 수 없습니다