XPath를 사용하여 파이썬 간단한 페이지 요소를 찾기

 LXML의 수입 HTML 

DEF : 파싱 ()
     "" " "HTML 파일의 내용 적은 경로를 추출하여 "" " 
    #의 판독 콘텐츠 파일 
    F = 열기 ( ' ./venv/static_/index.html를 ' , ' R & LT ' 인코딩 = " UTF-. 8 ' ) 
    S = 도달 f.read () 

    선택기 = html.fromstring (S)
     #의 J 파싱 표제 
    H3 = selector.xpath ( ' / HTML / 바디 / H3 / 텍스트 () ' )
     인쇄 (H3 [0]) # 여기에이 목록을 얻으려면, 나는 목록 가져 오기 사용 
    F를.닫기()

    # UL 내부의 내용물을 분석 
    UL = selector.xpath ( ' / HTML / 바디 / UL / 리 ' )
     # UL = selector.xpath ( '// UL / 리튬이')도 사용될 수있다 
    인쇄 (LEN (UL))
     에 대한에서 UL :
         전단 (li.xpath ( " 텍스트 () ' ) [0]) 

    #은 TR의 내부 내용 분석 
    #의 TR을 = selector.xpath ('/ TR / TD / 텍스트 / HTML / 바디 / 모양 / 테이블 () ) 
    #의 전단 (TR) 

    # 분석 요소 UL 지정된 값 
    UL2 = selector.xpath ( ' / HTML / 바디 / UL / 리 [@ 클래스 = "중요"] / 텍스트 () ' )
     전단 (UL2) 

    #의 분석은 UL 지정된 요소 속성
    selector.xpath = A ( ' // 사업부 / A / 텍스트 () [ID = "컨테이너"@] ' )
     인쇄 (A [0]) 

    # href를 속성 
    ALINK을 = selector.xpath ( ' // DIV [@ ID = "컨테이너"] / A / @ href를 ' )
     인쇄 합니다 (ALINK [0]) 

    #의 해석 태그 P를 
    p = selector.xpath ( ' / HTML / 바디 / P / 텍스트 () ' )
     #에 p = selector.xpath ('/ HTML / 몸 / P [마지막 ( )] / 텍스트 () ') # 마지막 오기 
    인쇄 (렌 (P))
     인쇄 (P [0]) 

    #의 사용 브라우징 XPath는 빌더 
    테스트 selector.xpath = ( ' / HTML / 바디 / 모양 / 표 / TR의 [. 1] / TH / 텍스트 () ')# 만을 배울 수 / HTML / 바디 / 모양 / 표 / TBODY / TR [. 1] / TH의 
    전단 (시험 [0]) 


IF  __name__ == ' __main__ ' : 
    파싱 ()를

 

추천

출처www.cnblogs.com/zsjlovewm/p/11106458.html