지니 인기차트 크롤링

권슬기·2023년 4월 14일

python

목록 보기

8/12

import requests
from bs4 import BeautifulSoup

URL = "https://www.genie.co.kr/chart/top200?ditc=M&rtm=N&ymd=20230101"
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(URL, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')

print(soup)


lis = soup.select('#body-content > div.newest-list > div > table > tbody > tr')

for li in lis:
    rank = li.select_one('.number').text[0:2].strip()
    title = li.select_one('.title').text.strip()
    artist = li.select_one('.artist').text.strip()

    print(rank, title, artist)

url에는 지니 인기 차트 페이지가 들어가면 된다.
soup.select('?') ==> 이 안에는 select 복사한 것이 오면 된다.

rank는 순위다. 순위를 가져오면 현재 순위와, 실시간 순위가 같이 나온다. 그래서 text[0:2]를 사용하여 현재 순위만 살림. strip()으로 앞뒤 여백을 없앰.

title도 strip()으로 앞뒤 여백을 없앰.

artist도 마찬가지.

결과

권슬기

병아리 프론트엔드 개발자

이전 포스트

mongoDB 데이터 찾기,수정,삭제 (2)

다음 포스트

지니 인기차트 크롤링

python

mongoDB 데이터 찾기,수정,삭제 (2)

python flask 5000 port 만들어서 사이트 띄우기

0개의 댓글