[제로베이스 데이터 취업 스쿨]
▷ 오늘 학습 계획: EDA 학습과제
주제: 이디야는 스타벅스 매장 근처에 있는가?
1) 서울시 스타벅스 매장 정보 가져오기(이름, 주소, 구 이름)
2) 서울시 이디야 매장 정보 가져오기(이름, 주소, 구 이름)
3) 시각화를 위한 데이터 정리
구별 스타벅스, 이디야 매장 개수 구하기
매장 주소를 이용해서 위도, 경도 데이터 얻기4) 시각화를 통한 검증
스타벅스, 이디야 매장 위치 확인하기
이디야, 스타벅스 구별 매장 분포 확인
이디야, 스타벅스 구별 매장 수 비교
selenium, beautifulsoup, DataFrame
스타벅스는 지역구를 선택할 때 스크롤을 내리는 명령도 필요했고, 이디야는 직접 구 이름을 입력해야 했다. 몇몇 지역구는 서울에만 있는 구가 아니여서 서울도 함께 명시했다.
selenium 기본 사용법을 알고 있었는데 막상 해보니까 생각보다 쉽지 않았다. 클래스, 태그 순서가 조금이라도 바뀌면 바로 에러가 나왔다. 하나씩 해보면서 이전에 배운 내용이 이해가 됐다.
selenium, beautifulsoup을 함께 사용해서 반복문으로 매장의 이름, 주소를 가져왔고 주소를 이용해서 구 이름을 정리했다.
시각화
데이터를 가져오는것 보다 시각화 과정이 오래 걸렸다. 어떻게 해야 이디야와 스타벅스 위치를 비교할 수 있을까 생각하다가 이것저것 시도해봤다.
도로명 주소를 가지고 위도, 경도 데이터를 가져오긴 했는데 매장이 너무 많아서 이디야가 스타벅스 근처에 있는지, 스타벅스가 이디야 근처에 있는지 확인하기 어려웠다.folium 지도시각화
매장의 분포를 보면 강남구에 스타벅스 매장이 눈에 띌 정도로 많고 특정 구(강남구, 중구, 서초구)에 집중되어 있다. 이디야 매장은 한 곳에 몰리지 않았고 서울 곳곳에 있으며 스타벅스 매장이 적은 도봉구, 강북구, 중랑구 등에도 골고루 분포되어 있다.
구별 매장 수 비교
서울시 자치구 7곳(강남구, 중구, 서초구, 영등포구, 종로구, 마포구, 송파구)을 제외하면 스타벅스보다 이디야 매장이 더 많다. 도봉구, 강북구, 중랑구, 동대문구의 이디야 매장 수는 스타벅스 매장 수의 2배 이상 많다.
결론
서울시 이디야 매장이 스타벅스 매장보다 많고, 구별 매장의 개수와 매장 분포를 종합적으로 고려했을 때 이디야 매장이 스타벅스 매장 근처에만 있는 것은 아니다.
따라서 이디야 매장의 위치는 스타벅스 매장의 위치와 상관이 없다.
📝 해설 강의 보고 느낀점
매장 정보를 가져오는 결과는 같지만 내가 작성한 코드는 더 길고 복잡했다. 위도, 경도 정보도 홈페이지에서 가져올 수 있었고 스타벅스는 구를 각각 선택하는 것보다 서울 전체 매장을 불러오는 게 훨씬 간단했다. 그리고 불러온 데이터를 정리하는 과정도 바로바로 진행되지는 않았던 것 같다.
이번 과제는 풀이 과정을 먼저 보고 복습하는 게 아니여서 더 기억에 남았다. 정해진 답을 찾기보다는 더 알아보고 공부하면서 효율적으로 결과를 찾아내는 연습을 많이 해야겠다.
▷ 내일 학습 계획: SQL 강의(기초1~3)