오늘은 기술블로그 느낌이 나도록 웹크롤링 예제를 보여주려고 한다. CGV 홈페이지에서 특정 영화의 댓글들을 크롤링하는 예제이다. k-digital training 에서는 'Toy 프로젝트'라는 이름으로 개인 프로젝트로 진행하였다. 개발자들이나 웹 관련 종사자들이
썸네일이미지 출처: https://www.pngwing.com/ko/search?q=cgv : 이전 포스팅에서까지 url을 뽑았다. 이제부터는 구체적인 전략을 말하겠다. 해당 영화 url에서 댓글, 날짜, 사용자 크롤링 예정댓글 페이지 수에 따른 구분댓글 페이
썸네일이미지 출처: https://www.pngwing.com/ko/search?q=cgvpart 01, part 02 순서대로 모두 이어지는 내용이다.이 포스팅은 part 03 으로 마지막 파트이다. '블랙위도우'로 예시를 들고 있다.part 01, part
썸네일 이미지 출처: https://www.kaggle.com/brand-guidelines 미니EDA 프로젝트 리뷰 지난 번 웹크롤링 Toy 프로젝트에 이어서 두 번째 프로젝트이다. EDA로서는 첫 프로젝티이기도 하다. 머신러닝을 이용하여 분석 및 예측까지 가지
썸네일 이미지 출처: https://www.dataapplab.com/how-to-be-top-10-at-kaggle-competition/kaggle-logo-gray-300/ EDA Review 04. 3차 컬럼(column) 선별 이전 포스트에서 마지막 부
썸네일 이미지 출처: https://www.dataapplab.com/how-to-be-top-10-at-kaggle-competition/kaggle-logo-gray-300/ 이전 포스트에서 범주를 재구성한 새로운 컬럼들이 있는데, 그 컬럼들의 원래 컬