소프트웨어 정보:
원래 WHATWG 공식 HTML5 규격을 따른다.
파서는 HTML 모든 맛을 처리하도록 설계 및 주요 데스크탑 웹 브라우저의 동작과 호환 잘 정의 된 오류 처리 규칙을 사용하여 유효 문서를 파싱한다.
출력은 트리 구조의 내부 palced된다.
그것은 ElementTree, DOM과 LXML 트리 형식으로 출력뿐만 아니라 간단한 사용자 지정 형식을 지원합니다.
HTML5Lib는 distutils를 함께 패키지로 제공됩니다.
HTML5Lib는 형태로도 주문 가능합니다 :
루비는 - 여기에 루비 HTML5Lib를 다운로드합니다.
파이썬은 - 여기 파이썬에 대한 HTML5Lib를 다운로드합니다.
PHP는 - 여기에 PHP에 대한 HTML5Lib를 다운로드
이 릴리스의 새로운 기능 :
은 나무에 유효하고 유효하지 않은 HTML 문서를 구문 분석합니다.
, ElementTree가, BeautifulSoup로 (더 이상 사용되지 않음) 및 사용자 정의 simpletree 출력 형식 (cElementTree 및 lxml.etree 포함) minidom 지원
SAX로 변환 DOM
보고서는 구문 분석 오류
문자 인코딩 검출
필터링 및 나무의 직렬화
HTML + CSS 소독제
많은 단위 테스트
댓글을 찾을 수 없습니다