태그로 되어있는 문서를 해석하는 기능을 가진 파이썬 모듈
from bs4 import BeautifulSoup
page = open(path, "r").read()
soup = BeautifulSoup(page, "html.parser")
tag
에 해당하는 태그를 처음 발견되는 하나를 찾음tag
를 모두 찾고자한다면 find_all
사용. 이 때 반환결과는 list
전체: *
태그 선택자: [tag name]
ID 선택자: #[id name]
클래스 선택자: .[class name]
복합 선택자: 태그, ID, 클래스를 이어서 작성하면 됨
p
태그 이면서 overview
라는 클래스를 가진 요소 선택: p.overview
후손 태그 선택: [부모 tag] [자손 tag]
자식 태그 선택: [부모 tag] > [자식 tag]