lxml

소프트웨어 스크린 샷:
lxml
소프트웨어 정보:
버전: 3.4.4 업데이트
업로드 날짜: 12 May 15
개발자: infrae.com
라이센스: 무료
인기: 245

Rating: 5.0/5 (Total Votes: 1)

LXML는 파이썬 언어의 단순함에 해당 라이브러리의 속도를 결합합니다.
2.4-3.2 모든 CPython의 버전과 호환

이 릴리스의 새로운 기능입니다.

lxml.html.iterlinks 지금 메타 새로 고침 태그 내부에 링크를 반환합니다.
새로운 XmlParser가 옵션 collect_ids = ID 해시 테이블 생성을 사용하지 않으려면 false입니다. 이 실질적으로 사용하지 않는 많은 다른 ID가 문서의 분석 속도를 높일 수 있습니다.
파서는 XML ID에 대한 당 문서 해시 테이블을 사용합니다. 이는 글로벌 파서 DICT의 부하를 줄이고 많은 다른 ID를 가진 문서를 구문 분석하는 속도가 빨라집니다.
ElementTree.getelementpath (요소) 나중에 조회에 사용할 수있는 지정된 요소에 대한 구조 ElementPath 식을 돌려줍니다.
XMLFILE은 ()가 true = 가까운 새로운 인수가 (-like) 그들에게 작성 후 오브젝트 파일을 닫습니다 받아들입니다. 이 내부적으로 열 더라면 전에, XMLFILE은 ()는 파일을 마감했다.
허용 & quot;이 ByteArray & quot; ASCII 텍스트 입력을 입력합니다.

3.4.2 버전의 새로운 기능 :

lxml.html.iterlinks 이제 메타 새로 고침 태그 내부에 링크를 반환합니다.
새로운 XmlParser가 옵션 collect_ids = ID 해시 테이블 생성을 사용하지 않으려면 false입니다. 이 실질적으로 사용하지 않는 많은 다른 ID가 문서의 분석 속도를 높일 수 있습니다.
파서는 XML ID에 대한 당 문서 해시 테이블을 사용합니다. 이는 글로벌 파서 DICT의 부하를 줄이고 많은 다른 ID를 가진 문서를 구문 분석하는 속도가 빨라집니다.
ElementTree.getelementpath (요소) 나중에 조회에 사용할 수있는 지정된 요소에 대한 구조 ElementPath 식을 돌려줍니다.
XMLFILE은 ()가 true = 가까운 새로운 인수가 (-like) 그들에게 작성 후 오브젝트 파일을 닫습니다 받아들입니다. 이 내부적으로 열 더라면 전에, XMLFILE은 ()는 파일을 마감했다.
허용 & quot;이 ByteArray & quot; ASCII 텍스트 입력을 입력합니다.

3.3.2 버전의 새로운 기능 :

속성 리졸버 및 버전뿐만 아니라 방법 set_element_class_lookup ()와 makeelement (), iterparse 개체에서 분실되었다.
된 XMLSchema, 스키마 트론과 RelaxNG의 인스턴스는 유효성 검사를 실행하기 전에 해당 지역의 error_log을 취소하지 않았다.
최대 및 혼합 quot을 lxml.doctestcompare 예상 & quot; 및 quot; 실제 & quot; 속성치.

버전 3.3.1의 새로운 기능 :

버그 수정 :
parser.feed를 사용한 구문 분석 HTML 문서는 () 태그 반복하는 동안 요소를 찾지 못했습니다.
PyPy의 건물로 인해 PyPy의 C-API에 PyUnicode_Compare ()와 PyByteArray _ * ()에 대한 지원을 누락에 실패했습니다.
MSVC에서의 컴파일 인해 누락 하 '실패, stdint.h & quot; 표준 헤더 파일입니다.
iterparse는 () BOM 파일을 접두사 구문 분석하지 못했습니다.

버전 3.3.0의 새로운 기능 :

버그 수정 :
URL의 파일 경로를 구분 발견 덜 위음성을 생산하기 위해 강화되었다.
3.2.2에서 손실 된 파이썬 2.4

고정 지원 :

버전 3.2.3의 새로운 기능입니다.

버전 3.2.1의 새로운 기능 : XSLT 확장 요소의

메소드 apply_templates을 ()와 process_children ()는 하나 모든 문자열을 삭제하는 두 개의 새로운 부울 옵션 elements_only 얻고 remove_blank_text있다 또는 공백 만 결과 목록에서 문자열.

3.2.0 버전의 새로운 기능 :

lxml.html에서 문자열 구문 분석 기능의 동작을 변경할 수있는 공백을 선도.
lxml.html의 문자열 구문 분석 기능은 프레임 셋 또는 누락 body 태그와 같은 드문 HTML 콘텐츠의 얼굴에 더 강력하다.
I / O 오류가 비 ASCII UnicodeDecodeError을 올릴 수있는 문자 대신 제대로 오류 IOError보고를 포함하는 경로를 갖는 파일에 액세스하는 동안.
메모리 문자열에서 기본 파서 비활성화 네트워크 액세스를 구문 분석 실패 URL에서 구문 분석하는 후속 시도했다.

3.1.2 버전의 새로운 기능 :

합격 (즉 handler.startElement () 메소드) 색소폰 다리의 이름 공간 인식 API를 통해 속성 형식 오류로 실패했습니다.
유니 코드 문자열을 결과 트리를 변환 할 때 XSLT 출력에 직렬화 오류가 수정되었습니다.

어떤 버전 3.0.2의 새로운 기능 : 건물에 대한 Cython 0.17.3로 전환하여 인터프리터 종료시

고정 충돌.

버전 3.0의 새로운 기능 :

C14N가 포함 접두사를 지정하면 독점 연재 중 최상위로 승격 할 수 있습니다.
(cpyext을 통해) PyPy의 구축을위한 초기 지원.
DTD의 객체는 선언에 대한 읽기 액세스를 허용하는 API를 얻었다.
xpathgrep.py는 라인 별 (예 : 그렙에서 출력) 구문 분석과 새로운 루트 태그 출력을 주변에 대한 지원을 얻었다.
주변 요소를 구축 할 때 lxml.builder에서 전자 공장 (예 : 문자열 서브 타입으로) 알려진 데이터 유형의 하위 유형을 받아들입니다.
선택적 태그 인수 트리 반복과 iterparse는 () 태그 세트를 전달하는 지원합니다. 그들이 태그와 일치하는 경우 트리 노드는 반복자에 의해 반환됩니다.

2.3.5 버전의 새로운 기능 :

충돌 element.remove에서 텍스트 노드를 병합 ().
색소폰 / 대상 파서 충돌 빈 문서 타입을보고.

2.3.4 버전의 새로운 기능 :

충돌 빈 공간 URI와 nsmap (요소 특성)을 구축.
오류 (또는 사용자 메시지) 스레드 XSLT 처리 중에 발생하는 경우 조건을 경주로 인해 충돌이 발생합니다.
XSLT 스타일 시트 컴파일 컴파일 오류를 무시할 수 있습니다.

추가 기능 :

2.3.3 버전의 새로운 기능 :
(가) 새로운 직렬화 옵션 with_tail과 DOCTYPE을 얻었다 lxml.html.tostring.
버그 수정 :
HTML 구문 분석에 대한 iterparse ()를 사용하여 시작 이벤트를 요청할 때 크래시가 수정되었습니다.
cssselect 더 선택기의 고정 구문 분석. 그것은 후손 연결자와 같이 의사 요소와 가상 클래스 전에 공백이 중요하다. & quot; E : 의사 & quot; 의사 & quot ;, & quot하지, E : E *; 바와 같이 동일한 구문을 분석해야 의사 & quot ;.
'SRC'속성이없는 'IMG'태그를 타격 할 때 lxml.html.diff 더 이상 예외가 발생하지 않습니다.

추가 기능 :

2.3.2 버전의 새로운 기능 :
lxml.objectify.deannotate ()는 객관화 네임 스페이스 선언을 제거 (일반적으로 네임 스페이스 선언을 정리) 유형의 주석을 제거한 후하는 새로운 부울 옵션 cleanup_namespaces 있습니다.
lxml.objectify는 사용자측의 lxml.etree 그렇지 않으면 중복을 피하기 위해 수입 etree.SubElement의 사본으로 자체 하위 요소 () 함수를 얻었다.
버그 수정 :
자손 & quot; & quot 고정; cssselect 버그 (LXML 2.3.1에서 처음 수정 후) 두 번째 시간입니다. 이전의 변화는 번역 식의 XPath를 기반으로 평가 심각한 성능 저하의 결과. 이 이전에 2.3.1에서 근무 XSLT 위치 경로로 생성 된 XPath 식의 일부의 사용을 중단합니다.
cssselect의 일부 선택기의 고정 구문 분석. & #의 X3E; 콤비 & quot 후 공백 & quot ;, & quot; + quot; 및 quot; ~ & quot; 올바르게 무시됩니다. 이전 후손 연결자로서 구문 분석된다. 예를 들어, & quot; DIV & #의 X3E; .foo & quot; DIV & #의 X3E; * .foo & quot 된 바와 같이 동일한 구문 분석; 대신 & quot의; DIV & #의 X3E, .foo & quot ;.

추가 기능 :

2.3.1 버전의 새로운 기능 :
lxml.html.clean의 새로운 옵션 kill_tags 특정 태그 및 그 내용 (즉, 자신의 전체 하위 트리)를 제거합니다.
pi.get ()과 처리 명령에 pi.attrib는 처리 명령의 텍스트 콘텐츠의 의사 특성을 분석한다.
lxml.get_include은 () lxml.etree에 대한 외부 C 코드를 컴파일하는 데 사용할 수있는 경로를 포함하는 목록을 반환합니다. 코드 자체 LXML과 동일한 헤더 파일 버전에 대해 컴파일 할 필요가있을 때 정적으로 링크 LXML 빌드를 위해이 특히 요구된다.
Resolver.resolve_file ()는 파일 (-like) 객체를 읽거나하지 후 폐쇄 될 경우 구성 추가 옵션 close_file 걸립니다. 사용자에 대한 참조를 유지하기 위해 예상과 기본적으로이 파일은 종료됩니다.
버그 수정 :
링크 : HTML 청소 '데이터'를 제거하지 않았다.
html5lib 파서 통합은 지금은 도서관의 새로운 릴리스와 함께 작동하게 html5lib 자체의 '공식'구현을 사용합니다.
해당 시작 이벤트가 디폴트 네임 스페이스에 동일한 태그 이름 일반 추론 때 lxml.sax에서 endElementNS ()는 잘못 일반 태그 이름을 거부 할 수있다.
열려있는 파일과 같은 개체를 구문 분석에 전달 될 때 () 또는 iterparse (), 파서는 더 이상 가까이 그것을 사용 후. 이것은 모든 파일이 폐쇄 될 LXML 2.3의 변화를 돌아갑니다. 그것은 제대로 오류의 경우도, 파일 (-like) 개체를 닫으은 사용자의 책임입니다.
lxml.html.cleaner에서 어설 션 오류가 최상위 요소를 폐기 할 때.
lxml.cssselect에서 (CSS의 후손 선택기 대신 '/ 하위 :: B'의 XPath는 ( '/ 하위 또는 - 셀프 :: 노드 () / (B)'의 줄임말) '// B에'사용 'B'). 이 웹킷과 파이어 폭스의 선택 행동과 일치하는 몇 가장자리 케이스를 만들고, (XSL에 사용 : 템플릿 경기) 더 CSS 표현 유효한 위치 경로를 만든다.
lxml.html에서 선택되지 않은 & #의 x3c, 옵션 & # X3E을; 태그가 더 이상 수집 양식 값에 나타나지 않는다.
추가 / 제거 & #의 x3c, 옵션 & # X3E을; 여러 선택 양식 필드가 적절하게 선택하고 그들을 선택 취소에서 /에 값.
기타 변경 사항 :
정적 --download-DIR 옵션을 다운로드 디렉토리를 지정할 수 있습니다 만듭니다.

추가 기능 :

2.3 버전의 새로운 기능 :
아이를 찾을 때 부모 네임 스페이스에 반대, lxml.objectify는, 빈 공간을 의미하는 것으로 '{} 태그'를합니다.
버그 수정 :
파일 - 류의 객체에서 읽기가 끝나면, 파서는 즉시 .close () 메서드를 호출합니다.
분석이 완료되면, iterparse는 () 즉시 입력 파일을 닫습니다.
(libxml2를 2.7.8에서 수정 된) 어떤 severly 깨진 문서를 분석 한 후 작동하지 않는 상태에서 HTML 파서를 남길 수 있습니다 libxml2를 버그에 대한 주위에 작업 할 수 있습니다.
HTML 정리 코드에서 나포 태그가 제대로 윤곽 지정됩니다.
기타 변경 사항 :
Cython 수준의 C-API의 일부 공공 기능을 더 명시 적 반환 형식이 있습니다.

버전 2.3beta1의 새로운 기능 :

버그 수정 :
새로운 libxml2를 버전 충돌 교체의 XInclude 노드의 속성을 가지고 문서 사이의 요소를 이동할 때.
XMLID () 함수는 옵션 파서와 BASE_URL 매개 변수를 누락되었습니다.
iterparse에서 와일드 카드 태그 검색 (는) Py3에서 부서졌다.
lxml.html.open_in_browser는 ()로 인해 os.tempnam의 사용에 파이썬 3에서 작동하지 않았다. 이제 옵션 '인코딩'매개 변수를 사용합니다.

유사한 소프트웨어

DOLFIN
DOLFIN

1 Mar 15

pygit2
pygit2

10 Dec 15

pyvat
pyvat

1 Mar 15

irclog2html
irclog2html

13 May 15

코멘트 lxml

댓글을 찾을 수 없습니다
코멘트를 추가
이미지를 켜십시오!