: 데이터를 수집하는 기술에는 스크레이핑과 크롤링이 있다.: 스크레이핑은 웹 사이트에서 특정 데이터를 수집하는 것이다.: 크롤링은 크롤러 또는 스파이더라는 프로그램으로 웹 사이트에서 데이터를 추출하는 것이다.: 웹에서 데이터를 수집하는 작업을 통틀어 크롤링이라고 한다.
: www.data.go.kr: 2017년부터 현재까지 우리나라에 입국한 중국인의 수 크롤링CODE 0 전체 작업 스토리를 구성한다.06행 : 데이터를 수집할 국가 코드를 입력받는다.07행 : 데이터를 수집할 시작 연도를 입력받는다.08행 : 데이터를 수집할 마지막 연
라이브러리 설치BeauitfulSoup을 임포트하여 사용연습용 html을 작성한다.BeautifulSoup 객체를 생성한다.객체에 저장된 html 내용을 확인한다.: 3에서는 분석할 HTML의 실제 웹페이지를 사용하지 않고 html 구조를 작성한 문자열을 사용한다.:
Selenium 라이브러리를 사용하여 동적 웹 페이지 크롤링을 실습한다. 커피 브랜드 중 하나인 커피빈의 전국 매장 정보를 크롤링해보자.
와인 유형에 따른 품질 등급을 히스토그램과 부분 회귀 플롯으로 시각화 해보자.
타이타닉호 승객 변수를 분석하여 생존율과의 상관관계를 찾고 생존과 가장 상관도가 높은 변수는 무엇인지 분석한다. 상관 분석을 위해 피어슨 상관 계수를 사용하고 변수 간의 상관관계는 시각화하여 분석한다.