LXML 파이썬 개발자는 파이썬 code.An XML 처리 librarylxml가 확장 마크 업 언어 (Extensible Markup Language XML 모두 XML 및 HTML 파일 내부에서 작동 할 수 있도록, libxml2를하고 libxslt를 라이브러리를 결합하는, 정교한 강력한, 무료 독특한 파이썬 모듈이다 파이썬 프로그래밍 언어로 작성된) 처리 라이브러리는, 구체적으로 최대한 ElementTree의 API 사양을 따르도록 설계.
그것은 이러한 NG (차세대)의 XPath, XML 스키마, C14N, XSLT (확장 가능한 스타일 시트 언어)를 진정으로 libxslt를하고 libxml2를 라이브러리의 특정 기능을 노출 ElementTree API를 확장 할 수 etc.Use의 LXML는에서 파이썬 코드를 호출 XSLT의 stylesheetsDevelopers는 확장 기능을 통해 XSLT 스타일 시트 및 XPath 표현식에서 파이썬 코드를 호출 lxml이 프로그램을 사용할 수 있습니다. 튜토리얼의 다양한 프로젝트 및 다른 URL에 사용할 수 있습니다;의 홈페이지 (문서의 끝 부분에있는 링크 참조).
이 소프트웨어는 설계에 의해 오픈 소스이고, 파이썬 및 다른 URL의 단순성과 상기 라이브러리의 기능 완전성과 속도를 결합;의 API (응용 프로그래밍 인터페이스) .Getting가 lxmlIt 시작은을 사용하여 GNU / 리눅스 배포판에 LXML를 설치하는 것은 매우 쉽다 소스 아카이브 Softoware 프로젝트 및 다른 URL에 분산;의 공식 웹 사이트. 단순히 터미널 응용 프로그램을 열고 추출 된 아카이브 파일의 위치 (예 : CD를 /home/softoware/lxml-3.4.1)로 이동, 압축을 풀고, 홈 디렉토리에 저장, 소스 패키지를 다운로드합니다.
& lsquo를 실행하여 확인 및 다른 URL; 현대 컴퓨터에 1 ~ 2 분 정도 걸릴해야합니다 프로그램을 컴파일 명령. 성공적으로 컴파일 후, & lsquo을 실행, 설치 및 다른 URL 확인; 루트 또는 명령 & lsquo; sudo를 설치 및 다른 URL 확인; 권한이있는 사용자로 명령은 GNU / 리눅스와 systemsThe 소프트웨어 Microsoft Windows 운영 공식적으로 GNU / Linux 및 Microsoft Windows 운영 체제에서 지원됩니다 LXML 시스템 wide.Supports를 설치합니다. 이 성공적으로 32 비트 및 64 비트 컴퓨터에서 테스트되었습니다
이 릴리스의 새로운 기능 무엇 :.
이 기능이 추가 :
새로운 htmlfile의 HTML 생성기는 증가 XMLFILE 직렬화 API를 동반합니다. 부락 아르 슬란에 의해 패치.
버그 수정 :
lxml.sax.ElementTreeContentHandler는 슈퍼 클래스를 초기화하지 않았다.
이 버전 3.3.1의 새로운 기능 :
이 버그가 수정 :
LP의 # 1014290 : parser.feed와 구문 분석 HTML 문서는 () 태그 반복하는 동안 요소를 찾지 못했습니다.
LP의 # 1273709 : PyPy의 건물로 인해 PyPy의 C-API에 PyUnicode_Compare ()와 PyByteArray _ * ()에 대한 지원을 누락에 실패했습니다.
LP 번호 1,274,413은 : MSVC에서의 컴파일 인해 누락 하 '실패; stdint.h & quot; 표준 헤더 파일입니다.
LP의 # 1274118 : iterparse는 () BOM 접두어가 붙은 파일들을 분석하는 데 실패했습니다.
이 버전 3.0 알파 2의 새로운 기능 :
이 기능이 추가 :
요소의 .iter () 메소드는 현재 quot 및 같은 태그 인수를 받아 {*} 이름 & quot; 어떤 네임 스페이스에 지정된 로컬 이름을 가진 요소를 검색합니다. 이 추가로 와일드 카드의 모든 조합이 지금 예상대로 작동 : & quot; {NS} 이름 & quot ;, & quot; {} 이름 & quot ;, & quot; {*} 이름 & quot ;, & quot; {NS} * & quot ;, & quot; {} * & quot; 및 quot; {*} * & quot ;. 그 및 참고 quot; 이름 & quot; 를 & quot 동일하다 {} 이름 & quot ;, & quot하지만 * quot를; 이다 & quot; {*} * & quot ;. strip_attributes (), strip_elements ()와 strip_tags () 함수; 같은 변화는) .getiterator (에 .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren ()와 .itertext () 메서드 적용 뿐만 아니라 iterparse () 클래스로.
C14N가 포함 접두사를 지정 허용하는 독점 연재 중 최상위로 승진한다.
버그 수정 :
공급 () 구문 분석기 인터페이스에 긴 유니 코드 문자열을 전달하면 전체 문자열을 읽지 못했습니다.
이 버전 2.3.5의 새로운 기능 :
이 충돌 element.remove에서 텍스트 노드를 병합 ().
색소폰 / 대상 파서 충돌 빈 문서 타입을보고.
이 버전 2.3.4의 새로운 기능 :
이 충돌 빈 공간 URI와 nsmap (Element 속성을) 건물입니다.
오류 (또는 사용자 메시지) 스레드 XSLT 처리하는 동안 발생할 때 조건을 경주로 인해 충돌이 발생합니다.
XSLT 스타일 시트 컴파일 컴파일 오류를 무시 할 수있다.
이 추가 특징 :
이 버전 2.3.2의 새로운 기능 :
lxml.objectify.deannotate ()는 객관화 네임 스페이스 선언을 제거 (일반적으로 네임 스페이스 선언을 정리) 유형 주석을 제거한 후하는 새로운 부울 옵션 cleanup_namespaces 있습니다.
lxml.objectify는 사용자측의 lxml.etree 그렇지 않으면 중복을 피하기 위해 수입 etree.SubElement의 복사본으로 자신의 하위 요소 () 함수를 얻었다.
버그 수정 :
자손 명세서 및 첨부 된 청구의 범위에서 quot 고정; cssselect 버그 (LXML 2.3.1에서 처음 수정 후) 두 번째 시간입니다. 이전 변경은 번역 식의 XPath를 기반으로 평가 심각한 성능 저하의 결과. 이 이전에 2.3.1에서 근무 XSLT 위치 경로로 생성 된 XPath 식의 일부의 사용을 중단합니다.
cssselect의 일부 선택기의 고정 구문 분석. 콤비 & quot 후 공백; 한다 & quot ;, & quot; + & quot; 및 quot; ~ & quot; 올바르게 무시됩니다. 이전 후손 연결자로서 구문 분석된다. 예를 들어, & quot; DIV한다 .foo & quot; 같은를 구문 분석 & quot; DIV있다 * .foo & quot; 대신 & quot; DIV있다 .foo & quot ;.
이 추가 특징 :
이 버전 2.3.1의 새로운 기능 :
lxml.html.clean의 새로운 옵션 kill_tags 특정 태그 및 그 내용 (즉, 자신의 전체 하위 트리)를 제거합니다.
pi.get () 및 처리 명령에 pi.attrib는 처리 명령의 텍스트 콘텐츠의 의사 특성을 분석한다.
lxml.get_include는 () lxml.etree에 대한 외부 C 코드를 컴파일하는 데 사용할 수있는 경로를 포함하는 목록을 반환합니다. 코드 자체 LXML와 동일한 헤더 파일 버전에 대해 컴파일 할 필요가있을 때 정적으로 링크 LXML 빌드를 위해이 특별히 필요합니다.
Resolver.resolve_file ()는 파일 (-like) 개체를 읽거나하지 후 폐쇄 될 경우 구성 추가 옵션 close_file 걸립니다. 사용자에 대한 참조를 유지하는 예상과 기본적으로이 파일은 종료됩니다.
버그 수정 :
링크 : HTML 청소 '데이터'를 제거하지 않았다.
html5lib 파서 통합은 지금은 도서관의 새로운 릴리스와 함께 작동하게 html5lib 자체의 '공식'구현을 사용합니다.
해당 시작 이벤트는 기본 네임 스페이스에 동일한 일반 태그 이름을 유추 할 때 lxml.sax에서 endElementNS는 () 잘못 일반 태그 이름을 거부 할 수 있습니다.
열려있는 파일 - 류의 객체가 구문 분석에 전달 될 때 () 또는 iterparse (), 파서는 더 이상 가까이 그것을 사용 후. 이것은 모든 파일이 폐쇄 될 LXML 2.3의 변화를 돌아갑니다. 그것은 제대로 오류의 경우도, 파일 (-like) 개체를 닫으은 사용자의 책임입니다.
lxml.html.cleaner에서 어설 션 오류가 최상위 요소를 폐기 할 때.
lxml.cssselect에서, (CSS의 후손 선택기 대신 'A / 자손 :: B'의 XPath는 ( 'A / 자손 아니면 자기 :: 노드 () / B'의 줄임말) '//의 B'를 사용 'B'). 이 웹킷과 파이어 폭스의 선택 행동과 일치하도록 몇 가장자리 케이스를 만들고, (XSL에 사용 : 템플릿 경기) 더 CSS 표현 유효한 위치 경로를 만든다.
lxml.html에서, 비 선택 태그가 더 이상 수집 양식 값에 나타나지 않는다.
추가 / 다중 선택 양식 필드로 / 값을 제거하는 것은 적절하게 선택하고을 선택 취소합니다.
기타 변경 사항 :
정적 --download-DIR 옵션을 다운로드 디렉토리를 지정할 수 있습니다 만듭니다.
이 추가 특징 :
이 2.3 버전의 새로운 기능 :
아이를 찾을 때 부모 네임 스페이스에 반대, lxml.objectify는, 빈 공간을 의미하는 것으로 '{} 태그'를합니다.
버그 수정 :
파일 - 류의 객체에서 읽기가 완료되면, 파서는 즉시 .close () 메서드를 호출합니다.
분석이 완료되면, iterparse는 () 즉시 입력 파일을 닫습니다.
(libxml2를 2.7.8에서 수정 된)도 심각한 깨진 문서를 분석 한 후 작동하지 않는 상태에서 HTML 파서를 남길 수 있습니다 libxml2를 버그에 대한-를 해결합니다.
HTML 정리 코드에서 나포 태그가 제대로 윤곽 지정됩니다.
기타 변경 사항 :
사이 썬 수준의 C-API의 일부 공공 기능을 더 명시 적 반환 형식을 가지고있다.
이 버전 2.2.8 / 2.3 베타 1의 새로운 기능 :
이 충돌 교체의 XInclude 노드의 속성을 가지고 문서 사이의 요소를 이동할 때 새로운 libxml2를 버전.
XMLID () 함수는 옵션 파서와 BASE_URL 매개 변수를 누락되었습니다.
iterparse에서 와일드 카드 태그 검색 (는) Py3에서 부서졌다.
lxml.html.open_in_browser는 ()로 인해 os.tempnam의 사용에 파이썬 3에서 작동하지 않았다. 이제 옵션 '인코딩'매개 변수를 사용합니다.
이 요구 사항 :
이 파이썬
댓글을 찾을 수 없습니다