Web Scraping

TaeWoo Lee / Kris·2022년 1월 26일
0

HTML & CSS

  • HTML
    • 웹 페이지에서 보여지는 것들이 어떻게 어떤 방식으로 보여져야 하는지 알려주는 마크업 언어
  • CSS
    • 웹 페이지 문서가 어떻게 표현되는지 알려주는 스타일시트 언어

DOM

  • 프로그래밍 언어를 통해서 HTML 문서 등에 접근
    • getElementsByTagName : 태그 이름으로 문서의 요소들을 리턴
    • getElementById : 'id' 가 일치하는 요소들을 리턴
    • getElementsByClassName : '클래스' 가 일치하는 요소들을 리턴
    • querySelector : 셀렉터(들)과 일치하는 요소를 리턴
    • querySelectorAll : 셀렉터(들)과 일치하는 모든 요소들을 리턴

Web Scraping

# $ pip install requests
import requests
url = 'https://google.com'
resp = requests.get(url)

# $ pip install beautifulsoup4
import requests
from bs4 import BeautifulSoup
url = 'https://google.com'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
profile
일단 저지르자! 그리고 해결하자!

0개의 댓글