XPath(XML Path Language)에 대하여
2023. 4. 23. 19:02ㆍ학습
XPath(XML Path Language)
XPath는 XML 문서의 요소와 속성을 탐색하고 선택하기 위한 언어. ( XML 글 참고 )
웹 스크래핑에서는 HTML 문서의 요소를 선택하는 데 사용할 수 있다.
Selenium 및 BeautifulSoup과 같은 웹 스크래핑 도구에서는 XPath를 사용하여 원하는 요소를 정확하게 찾을 수 있습니다.
XPath 구문
/: 루트 노드부터 선택
//: 문서의 어느 위치에서든지 선택
.: 현재 노드를 선택
..: 부모 노드를 선택
@: 속성 선택
XPath 예
- /html/body: 루트 노드부터 시작하여 HTML 노드의 자식인 body 노드를 선택합니다.
- //div: 문서의 모든 div 요소를 선택합니다.
- //div[@class='example']: 모든 div 요소 중 class 속성이 'example'인 요소를 선택합니다.
- //div/*: 모든 div 요소의 모든 자식 요소를 선택합니다.
- //div[@id='content']/p: id 속성이 'content'인 div 요소의 자식 중 p 요소를 선택합니다.
결론
- XPath는 복잡한 웹 페이지에서도 특정 요소를 쉽게 선택할수 있다.
- Selenium과 함께 사용하면 웹 페이지의 동적 요소를 선택하고 상호 작용 하기에 좋다!
728x90
'학습' 카테고리의 다른 글
크롤링 한 데이터 사용의 법적 문제(cf. robots.txt) (0) | 2023.04.25 |
---|---|
패키지와 라이브러리의 차이? (0) | 2023.04.24 |
XML의 계층적 구조 (+ json) (0) | 2023.04.23 |
XML과 JSON 의 차이점 (0) | 2023.04.23 |
XML(eXtensible Markup Language) (0) | 2023.04.23 |