29_EDA(6)

ryu·2023년 6월 21일
0

Beautiful Soup

Beautiful Soup이란?

  • 태그로 되어있는 문서를 해석하는 기능을 가진 파이썬 모듈

    from bs4 import BeautifulSoup
    
    page = open(path, "r").read()
    soup = BeautifulSoup(page, "html.parser")

.find(tag), .find_all(tag)

  • tag에 해당하는 태그를 처음 발견되는 하나를 찾음
  • 해당하는 tag를 모두 찾고자한다면 find_all 사용. 이 때 반환결과는 list

CSS 선택자 정리

  • 전체: *

  • 태그 선택자: [tag name]

  • ID 선택자: #[id name]

  • 클래스 선택자: .[class name]

  • 복합 선택자: 태그, ID, 클래스를 이어서 작성하면 됨

    • ex) p태그 이면서 overview라는 클래스를 가진 요소 선택: p.overview
  • 후손 태그 선택: [부모 tag] [자손 tag]

    • 후손태그는 부모 태그에서 1 level 이상 하위에 있는 모든 태그를 의미
  • 자식 태그 선택: [부모 tag] > [자식 tag]

    • 자식 태그는 부모태그에서 1 level 하위에 있는 태그

참고자료

0개의 댓글