데이터 취업 스쿨 교육 15회차 내용 정리

Reallee·2023년 10월 15일
0

데이터 취업 스쿨

목록 보기
15/19
post-thumbnail

동적 페이지 크롤링

4. Selenium의 기본 기능(3)

  • 검색어 입력

5. selenium + beautifulsoup

6. selenium으로 데이터 수집

  • 자료 수집 사이트 진입
    - 팝업창이 있는 경우 창전환 후 팝업창 클로즈 이후 진입 진행

  • 취득하고자 하는 데이터를 선택할 수 있는 곳의 키값을 찾은 이후 수집 진행
    - tqdm을 이용해 진행상황 확인
    • time을 이용해 진행 속도로 인한 오류발생 여부 제거

7. 수집한 데이터 가공

  • concat을 이용한 데이터 붙이기

  • pandas를 이용한 DataFrame 구축 후 구별 columns 생성

  • 가격정보를 foloat으로 변환하기 위해 "-"값 제거 후 DataFrame 재구축

  • index 재정렬 후 중복자료 삭제

8. 데이터 시각화

  • seaborn의 boxplot을 이용한 시각화
    - x축은 상표, y축은 가격으로 설정

  • 각 구별 평균 가격 기반 시각화
    • 평균가격 산출
    • 지도 시각화

profile
초심자 입니다!

0개의 댓글