크롬개발자도구 이용하기 - 3월 1일

조준수·2023년 3월 6일

크롬개발자 크롬개발자도구

웹데이터 2

6 실습 - 크롬 개발자 도구 이용하기 - 1

import
(1) from urllib.request import urlopen
(2) from bs4 import BeautifulSoup
url
url = "https://finance.naver.com/marketindex/"
page = urlopen(url)
soup = BeautifulSoup(page, "html.parser")
print(soup.prettify())

8 실습 - 크롬 개발자 도구 이용하기 - 3

pip install request
find, findAll = select, select_one
필요한 리스트만 찾기
(1) exchangeList = soup.select("#exchangeList > li")
(2) 아이디는 #exchangeList
(3) 클래스면 .exchangeList
(4) > 는 바로 밑에라는 의미

웹데이터 3~4

11 실습 - 위키백과 문서 정보 가져오기

url decode 검색
(1)
html = "https://ko.wikipedia.org/wiki/%EC%97%AC%EB%AA%85%EC%9D%98_%EB%88%88%EB%8F%99%EC%9E%90"
(2) 이럴 때 url decode를 검색해서 해결하라
(3) 글자를 URL로 인코딩
req = Request(html.format(search_words=urllib.parse.quote("여명의 눈동자")))

13 실습 - list 데이터형

Ctrl+Enter
(1) 셀이 내려가지 않고 같은 자리에서 실행한다.
isinstance( )
(1) 자료형 True/False

18 실습 - 시카고 맛집 데이터 하위 페이지 분석

특정 페이지 읽기
(1) 예시
ua = UserAgent()
req = Request(df["URL"][0], headers={"user-agent":ua.ie})
html = urlopen(req).read()
soup_tmp = BeautifulSoup(html, "html.parser")
soup_tmp
가격만 추출하기
(1) '\n$10. 2109 W. Chicago Ave'
(2) re.search("\S\d+.(\d+)?", price_tmp).group()

print(‘안녕하세요! 반갑습니다!’)

이전 포스트

folium 지도 시각화 - 2월 28일

다음 포스트

셀레니움 selenium 기초 - 3월 2일

0개의 댓글