3주차 개발일지

호두·2021년 10월 18일
0
post-thumbnail


OT날부터 하루에 들을 수 있는 8강을 꽉 채워 들어서인지 1등 유지중

파이썬 기초, 파이썬을 활용한 웹페이지 크롤링, mongoDB, robo3T사용법을 배웠다.
파이썬 라이브러리(패키지)는 처음 사용해봤다. open API에서 데이터를 가져오는 데 requests, 크롤링을 위해 beautifulsoup4를 사용했다.

(위는 수업자료에 있는 이미지) 네이버 영화 페이지에서 순위, 제목, 별점을 크롤링했다.

3주차 숙제로 지니뮤직 사이트를 스크래핑하며 서치도 더 해보고 연습하다보니 좀더 감이 잡혔다. 특히 .strip 함수는 순위와 곡명을 가져왔을때 함께 따라온 공백을 제거해줘서 편리하다.

순위의 경우 '상승' 같은 다른 문자열도 따라붙었다. 강의에서는 .text[0:2]로 두번째 문자열까지 잘라냈는데 나는 검색을 통해 .split 함수로 문자열을 리스트 ['1','상승']로 변경한 후 [0]번째를 가져와봤다. 이 방법이 순위의 자릿수와 여백 길이에 영향받지 않아서 더 좋지 않을까?

앞서 스크래핑한 영화 페이지를 반복문 통해 print()만 해보았다면, 이번에는 pymongo를 임포트 한 뒤 반복문 안에 doc 딕셔너리를 만들어 .insert_one으로 쭉쭉 db에 넣어보았다.(insert 연습)

이렇게 만들어진 db에서 .find_one으로 원하는 조건의 데이터를 가져오고, .update_one으로 특정 데이터를 업데이트까지 했다.(find와 update 연습)

백엔드에 대해서는 전혀 몰랐기에 내가 데이터베이스를 다뤘다는 사실이 정말 좋았다.

profile
web developer

0개의 댓글