211214 TIL

CoderS·2021년 12월 14일
0

TIL DAY 131

오늘 배운 일

✔️ Python 중급

1. 파이썬의 대표적인 패키지들

데이터 분석 & 시각화

numpy

numpy는 행렬(다차원 배열)을 다루는 패키지이다. 데이터 분석이나 머신 러닝을 할 때에는 데이터가 행렬 형식인 경우가 많다.

pandas

pandas는 데이터를 우리가 쉽게 다룰 수 있도록하는 테이블 형식으로 만들어 준다. 결국 데이터 분석이나 머신 러닝을 하려면 데이터를 다뤄야 하기 때문에 pandas는 데이터 분석의 가장 핵심적인 패키지라고 할 수 있다. 거의 모든 데이터 사이언스 패키지들은 pandas 와 연동된다.

matplotlib

matplotlib은 파이썬에서 가장 많이 쓰이는 데이터 시각화 라이브러리이다. 일반적인 그래프들은 거의 다 matplotlib으로 그릴 수 있다고 보면된다.

seaborn

seaborn은 matplotlib를 기반으로 한 시각화 라이브러리이다. matplotlib 보다 간단한 문법을 사용해서 더 예쁜 그래프들을 그릴 수 있는 장점이 있다.

머신 러닝

sklearn

sklearn은 가장 대중적인 머신 러닝 라이브러리입니다. 기본적인 머신 러닝 알고리즘은 모두 지원하면서 데이터 가공, 모델 평가 기능도 제공한다.

tensorflow, pytorch, keras

모두 딥러닝에 최적화된 라이브러리들이다. 컴퓨터 비전에 많이 사용되는 CNN (Convolutional Neural Network), 자연어 처리에 많이 사용되는 RNN (Recurrent Neural Network) 모델 등을 구현할 수 있는 기능들이 있다.

nltk

nltk는 텍스트 데이터 가공, 시각화 등을 지원하는 자연어 처리 라이브러리이다.

웹 개발

django

django는 파이썬에서 많이 쓰이는 웹 프레임워크이다.

일반적으로 프레임워크는 어떤 소프트웨어의 뼈대 같은 역할을한다. 웹 프레임워크는 웹 애플리케이션을 만들기 위한 뼈대여서 우리는 뼈대를 제외한 나머지 디테일을 채워 넣기만 하면 된다.

flask

flask는 파이썬에서 많이 쓰이는 또 다른 웹 프레임워크이다. django 웹 개발에 필요한 모든 기능을 제공하지만 비교적 복잡하고 flask는 기본적인 기능만 제공하지만 비교적 간단하다.

기타

beautifulsoup4

beautifulsoup4는 html 또는 xml 문서를 파싱(원하는 데이터를 특정 패턴이나 순서로 추출해 가공하는 것)해 주는 라이브러리이다. 보통 웹에서 원하는 데이터를 긁어 오는 작업인 웹 스크레이핑 (web scraping)에 많이 사용된다.

selenium

selenium은 웹 브라우저 동작을 자동화해 주는 패키지이다. selenium을 사용하면 클릭, 로그인, 검색, 스크롤링 등을 자동화할 수 있습니다. 웹 애플리케이션 테스팅 자동화와 웹 스크레이핑에 많이 사용된다.

requests

requests는 파이썬의 간편한 http 라이브러리이다. requests 라이브러리를 통해 쉽게 http 요청을 보낼 수 있다.

opencv

opencv는 컴퓨터 비전에 많이 사용되는 라이브러리이다. 이미지 프로세싱, 얼굴 인식, 문자 인식 등 많은 기능을 제공한다.

2. 파이썬으로 유튜브 영상 다운로드

우선, 전에 설치해둔 pandas 패키지를 사용하기 전에, 다른 패키지를 사용해보겠다.

https://pypi.org/

위의 링크를 클릭해서, 검색창에 youtube dl이라고 쳐준다.

youtube dl은 유튜브를 비롯한 여러 웹사이트에서 동영상을 다운받는데 쓰인다.

이 패키지를 사용하면 코드 몇 줄로 쉽게 다운로드가 가능하다.

유튜브에서 원하는 영상을 골라서 해도 된다.

우선 PyCharm으로 가서 File -> settings을 눌러준다.

그리고 Python Interpreter를 클릭해서 안에 + 플러스 표시를 클릭해준다.

검색창에 youtube_dl이라고 치고 상위에 있는 패키지를 설치해준다.
(어제와 동일한 방법)

새로운 파일을 만들어서...

위에처럼 코드를 작성하면된다.

첫 줄은 YoutubeDL 이라는 프로그래밍 객체를 생성해서 ydl 이라는 변수에 저장해주는 코드이다.

유튜브 dl 객체는 주어진 웹사이트에서 영상들을 다운로드 할 수 있는 기능들을 가지고있다.
다운받고 싶은 링크를 대괄호 (리스트)안에 넣어주면 된다.

유튜브 주소를 하나만 넣는게 아니라 여러개의 주소를 넣을 수 있다.

또한, 재생목록을 넣을 수 있는데 그 경우에는 모든 영상들이 다운로드 된다.

원하는 주소를 리스트 안에 넣으면...

이렇게 쉽게 영상을 다운로드 할 수 있다.

끝으로 :

  • 오늘은 파이썬에서 쓰이는 대표적인 패키지들과 웹에서 유튜브나 다른 사이트를 통해서 영상을 다운로드 할 수 있는 패키지에 대해 알아봤다.
  • 영상을 가져올려고 할 때 꼭 패키지를 다운로드하고 해야 에러가 발생하지 않는다.
profile
하루를 의미있게 살자!

0개의 댓글