제로베이스_EDA/웹크롤링(7)_Naver API

KulangK·2023년 6월 7일
0

EDA/웹크롤링

목록 보기
8/9
post-thumbnail

📄 목차

  1. 네이버 API 사용
    • URL 생성 - 기능
    • 결과 받기 - 기능
    • DataFrame화 - 기능
    • 기능 조합하여 정보 모으기
    • 엑셀 저장
  2. 실습
    • URL 생성 - 기능
    • 결과 받기 - 기능
    • DataFrame화 - 기능
    • 기능 조합하여 정보 모으기
    • 엑셀 저장과 시각화

1. 네이버 API 사용 (순서 흐름)

  • 순서 흐름도


1. URL 생성 (기능 만들기)

  • api_node = 어떤 카테고리 검색할 것인지? (블로그, 쇼핑, 카페글...)
  • search_text = 어떤 item을 검색할 것인지? (책 이름, 글 내용, 구매하고 싶은 물품 이름...)
  • start_num = 몇 번째 부터 검색?
  • disp_num = 몇 개를 출력?

2. 결과 받기 (기능 만들기)


3. DataFrame화 시키기 (기능 만들기)


4. 만든 기능들을 조합하여 대량의 정보 모으기

  • 1~3에서 만든 기능들을 이용하여 1000개의 정보를 모으는 모습

5. 엑셀 저장


  • 모으고 정리된 데이터는 아래처럼 시각화에 사용가능

2. 실습

1. URL 생성 (기능 만들기)


2. 결과 받기 (기능 만들기)


3. DataFrame화 시키기 (기능 만들기)


4. 만든 기능들을 조합하여 대량의 정보 모으기

  • 밑에서 세번째에 원래 999가 아니라 99까지만 인덱스가 적혀있었음. 이를 수정하려고 한 것

5. 엑셀 저장과 시각화

  • seaborn 업데이트로 인한 것인지, x=이라고 정해주지 않으면 data가 두 개 이상 들어간 것으로 인식되어 오류 생김.
profile
새싹 데이터 분석가 https://github.com/KulangK

0개의 댓글