Youtube API 데이터를 크롤링할지 직접 코드를 짜면서 시각화할 수 있을 정도로 데이터를 추출해 보기로 했다. git organization을 통해 서로 앞으로 코드를 형상 관리 할 수 있는 환경을 만들었다.Trello를 사용해 보기로 하였다. JIRA와 달리 하나의 보드에서 깔끔하게 관리가 가능해 장기 프로젝트가 아닌 단기 프로젝트에 매우 유용하다고 생각했다. Trello는 다음과 같이 구상했다.
Project Resources: 각Label의 의미와 리스트 사용 등 앞으로Trello를 어떻게 사용해야 할지 가이드 라인의 개념으로 두었다.Upcoming: 예정된 업무(카드)를 할당해 둔다.In Progress: 예정된 일을 진행하기 시작했다면 카드의 위치를 이 리스트로 바꾸어 진행 중이라는 것을 공유되도록 하였다.Done: 완료가 된 업무는 이곳에 종료하도록 한다.Trouble Shooting: 특정 업무(카드) 진행 중 문제가 발생한다면 해당 문제에 대한 카드를 생성해 이곳에 두기로 하였다. 또한 해당 업무는 지금 진행 중인 업무이므로In Progress의 상태로 유지하되help라는Label을 붙이도록 하였다.
📚 [유튜브 데이터 크롤링 및 시각화 프로젝트] 1. YOUTUBE API 사용 환경 설정
음악이라는 카테고리를 정했고, 처음 음악이라는 카테고리의 데이터를 추출 및 분석할 유튜버들을 정할 때는 나름의 기준을 두었다. 가수라는 직업과는 별개로 두고 유튜버 중에서만 선출한다. 최대한 다양한 콘텐츠의 음악 유튜버들로 분석한다.❗ YouTube API 분석을 위한
음악카테고리의 유튜버 선정
때잉: 곡 해석 및 추천 유튜버쏘플: 팝송 해석 및 추천 유튜버때껄룩: playlist 유튜버네고막을책임져도될까: playlist 유튜버임팝TV: C-pop 해석 및 추천 유튜버Mellowbeat Seeker: 힙합, LoFi 추천 유튜버
1.
googleapiclient와oauth2client모듈 설치 오류
- 개인적으로 이 문제를 해결하느라 한 시간 반 이상은 걸렸던 것 같다.
- 문제는 이 두 모듈은
YouTube API를 활용하기 위해 꼭 필요한 모듈인데 두 모듈을pip명령어를 통해 설치해도 막상 프로젝트 파일에 들어가 호출하면ModuleNotFoundError: No module named ‘googleapiclient’이라는 오류가 뜨는 것이었다.- 첫 번째로 이 문제가 발생한 원인은
googleapiclient를 설치하기 위해서는pip install google-api-python-client명령어를 사용해야 한다. 보통 우리는 모듈을 설치할 때pip module-name을 사용한다. 예를 들어, 같이 설치해야 하는oauth2client역시 마찬가지로pip oauth2client명령어를 통해 설치하지만googleapiclient는 그럴 경우 모듈을 찾지 못한다.- 그럼에도 불구하고 계속 같은 오류가 발생하였다. 결정적으로는 파이썬은
C 드라이브에 있는데D 드라이브에 프로젝트 파일을 생성하고 활용하고 싶어 명령창에서D 드라이브에 맞춰 두고 설치하여 문제였다. 설치가 되는 과정에서는 아무런 문제가 없어 설치가 되었다 생각했는데 막상 파일에 들어가면 파이썬은C 드라이브에 있기 때문에D에 설치해 놓은 모듈을 찾지 못하는 것이다. 결국 cmd 창에서cd (파이썬의 실제 위치)에 맞춰 둔 후 다시 모듈을 설치하고 실행하니 제대로 모듈이 읽히는 것을 확인할 수 있었다.- 사실 제일 간편한 방법은
jupyter lab을 사용하는 것이었다.jupyter lab을 통해 해당 명령어를 입력하면 호출에 오류가 나지 않았고 바로 사용 가능했다.%pip install google-api-python-client %pip install oauth2client