LXML 래퍼로 설계, 지금은 일반적으로 HTML 데이터 마이닝에 필요한 모든 기능을 LXML을 확장
이 특징 :.
가 일반 특징 :
좋은 jQuery를 같은 CSS 선택기
요소 속성에 대한 간단한 접근
다른 형식으로 변환 HTML을위한 쉬운 방법 (BBCode는, 마크 다운 등)
텍스트 작업에 대한 몇 가지 좋은 기능
LXML의 모든 원래의 기능을 저장
기능은 순수 텍스트로 작업하기 :
to_unicode은 - 유니 코드 문자열로 문자열을 변환
문자열에서 스트립 악센트 - strip_accents
문자열에서 스트립 추한 유니 코드 기호 - strip_symbols
strip_spaces - 문자열에서 초과 공백을 벗겨
strip_linebreaks - 문자열에서 여분의 줄 바꿈을 벗겨
이 요구 사항 :
이 LXML
댓글을 찾을 수 없습니다