인프런 강의 <파이썬입문과 크롤링기초 부트캠프>을 듣고, 중요한 점을 정리한 글입니다.
: 웹사이트에서 내가 원하는 내용을 자동으로 추출하는 기능
import requests
from bs4 import BeautifulSoup
res = requests.get('https://n.news.naver.com/mnews/article/001/0014225865?rc=N&ntype=RANKING')
res.content
파싱이란?
: 문자열의 의미 분석
이것을 어떻게 일일이 코드로 만들까?
‑> BeautifulSoup 라이브러리가 있습니다.
soup 에 HTML 파일을 파싱한 정보가 들어감!
soup = BeautifulSoup(res.content, 'html.parser')
soup
mydata = soup.find('h2')
mydata.get_text()