✔️ Python 중급
데이터 분석 & 시각화
numpy
numpy는 행렬(다차원 배열)을 다루는 패키지이다. 데이터 분석이나 머신 러닝을 할 때에는 데이터가 행렬 형식인 경우가 많다.
pandas
pandas는 데이터를 우리가 쉽게 다룰 수 있도록하는 테이블 형식으로 만들어 준다. 결국 데이터 분석이나 머신 러닝을 하려면 데이터를 다뤄야 하기 때문에 pandas는 데이터 분석의 가장 핵심적인 패키지라고 할 수 있다. 거의 모든 데이터 사이언스 패키지들은 pandas 와 연동된다.
matplotlib
matplotlib은 파이썬에서 가장 많이 쓰이는 데이터 시각화 라이브러리이다. 일반적인 그래프들은 거의 다 matplotlib으로 그릴 수 있다고 보면된다.
seaborn
seaborn은 matplotlib를 기반으로 한 시각화 라이브러리이다. matplotlib 보다 간단한 문법을 사용해서 더 예쁜 그래프들을 그릴 수 있는 장점이 있다.
머신 러닝
sklearn
sklearn은 가장 대중적인 머신 러닝 라이브러리입니다. 기본적인 머신 러닝 알고리즘은 모두 지원하면서 데이터 가공, 모델 평가 기능도 제공한다.
tensorflow, pytorch, keras
모두 딥러닝에 최적화된 라이브러리들이다. 컴퓨터 비전에 많이 사용되는 CNN (Convolutional Neural Network), 자연어 처리에 많이 사용되는 RNN (Recurrent Neural Network) 모델 등을 구현할 수 있는 기능들이 있다.
nltk
nltk는 텍스트 데이터 가공, 시각화 등을 지원하는 자연어 처리 라이브러리이다.
웹 개발
django
django는 파이썬에서 많이 쓰이는 웹 프레임워크이다.
일반적으로 프레임워크는 어떤 소프트웨어의 뼈대 같은 역할을한다. 웹 프레임워크는 웹 애플리케이션을 만들기 위한 뼈대여서 우리는 뼈대를 제외한 나머지 디테일을 채워 넣기만 하면 된다.
flask
flask는 파이썬에서 많이 쓰이는 또 다른 웹 프레임워크이다. django 웹 개발에 필요한 모든 기능을 제공하지만 비교적 복잡하고 flask는 기본적인 기능만 제공하지만 비교적 간단하다.
기타
beautifulsoup4
beautifulsoup4는 html 또는 xml 문서를 파싱(원하는 데이터를 특정 패턴이나 순서로 추출해 가공하는 것)해 주는 라이브러리이다. 보통 웹에서 원하는 데이터를 긁어 오는 작업인 웹 스크레이핑 (web scraping)에 많이 사용된다.
selenium
selenium은 웹 브라우저 동작을 자동화해 주는 패키지이다. selenium을 사용하면 클릭, 로그인, 검색, 스크롤링 등을 자동화할 수 있습니다. 웹 애플리케이션 테스팅 자동화와 웹 스크레이핑에 많이 사용된다.
requests
requests는 파이썬의 간편한 http 라이브러리이다. requests 라이브러리를 통해 쉽게 http 요청을 보낼 수 있다.
opencv
opencv는 컴퓨터 비전에 많이 사용되는 라이브러리이다. 이미지 프로세싱, 얼굴 인식, 문자 인식 등 많은 기능을 제공한다.
우선, 전에 설치해둔 pandas 패키지를 사용하기 전에, 다른 패키지를 사용해보겠다.
위의 링크를 클릭해서, 검색창에 youtube dl이라고 쳐준다.
youtube dl은 유튜브를 비롯한 여러 웹사이트에서 동영상을 다운받는데 쓰인다.
이 패키지를 사용하면 코드 몇 줄로 쉽게 다운로드가 가능하다.
유튜브에서 원하는 영상을 골라서 해도 된다.
우선 PyCharm으로 가서 File -> settings을 눌러준다.
그리고 Python Interpreter를 클릭해서 안에 + 플러스 표시를 클릭해준다.
검색창에 youtube_dl이라고 치고 상위에 있는 패키지를 설치해준다.
(어제와 동일한 방법)
새로운 파일을 만들어서...
위에처럼 코드를 작성하면된다.
첫 줄은 YoutubeDL 이라는 프로그래밍 객체를 생성해서 ydl 이라는 변수에 저장해주는 코드이다.
유튜브 dl 객체는 주어진 웹사이트에서 영상들을 다운로드 할 수 있는 기능들을 가지고있다.
다운받고 싶은 링크를 대괄호 (리스트)안에 넣어주면 된다.
유튜브 주소를 하나만 넣는게 아니라 여러개의 주소를 넣을 수 있다.
또한, 재생목록을 넣을 수 있는데 그 경우에는 모든 영상들이 다운로드 된다.
원하는 주소를 리스트 안에 넣으면...
이렇게 쉽게 영상을 다운로드 할 수 있다.
끝으로 :