29_EDA(6)

ryu·2023년 6월 21일

Beautiful Soup

태그로 되어있는 문서를 해석하는 기능을 가진 파이썬 모듈

from bs4 import BeautifulSoup

page = open(path, "r").read()
soup = BeautifulSoup(page, "html.parser")

전체: *
태그 선택자: [tag name]
ID 선택자: #[id name]
클래스 선택자: .[class name]
복합 선택자: 태그, ID, 클래스를 이어서 작성하면 됨
- ex) p태그 이면서 overview라는 클래스를 가진 요소 선택: p.overview
후손 태그 선택: [부모 tag] [자손 tag]
- 후손태그는 부모 태그에서 1 level 이상 하위에 있는 모든 태그를 의미
자식 태그 선택: [부모 tag] > [자식 tag]
- 자식 태그는 부모태그에서 1 level 하위에 있는 태그