XPath(XML Path Language)에 대하여

2023. 4. 23. 19:02학습

XPath(XML Path Language)

XPath는 XML 문서의 요소와 속성을 탐색하고 선택하기 위한 언어. ( XML 글 참고 )

웹 스크래핑에서는 HTML 문서의 요소를 선택하는 데 사용할 수 있다. 

Selenium 및 BeautifulSoup과 같은 웹 스크래핑 도구에서는 XPath를 사용하여 원하는 요소를 정확하게 찾을 수 있습니다.

 

XPath 구문

/: 루트 노드부터 선택
//: 문서의 어느 위치에서든지 선택
.: 현재 노드를 선택
..: 부모 노드를 선택
@: 속성 선택

 

XPath 예
  • /html/body: 루트 노드부터 시작하여 HTML 노드의 자식인 body 노드를 선택합니다.
  • //div: 문서의 모든 div 요소를 선택합니다.
  • //div[@class='example']: 모든 div 요소 중 class 속성이 'example'인 요소를 선택합니다.
  • //div/*: 모든 div 요소의 모든 자식 요소를 선택합니다.
  • //div[@id='content']/p: id 속성이 'content'인 div 요소의 자식 중 p 요소를 선택합니다.

 

결론
  • XPath는 복잡한 웹 페이지에서도 특정 요소를 쉽게 선택할수 있다.
  • Selenium과 함께 사용하면 웹 페이지의 동적 요소를 선택하고 상호 작용 하기에 좋다!

 

728x90