파이썬 설치의 의미
파이썬 문법으로 된 것을 변환해줄 수 있도록, 번역 패키지를 설치하는 것
a = 3 --> 3을 a에 넣는다
b = a --> a를 b에 넣는다
a = a + 1 --> a+1을 다시 a에 넣는다
num1 = ab --> ab의 값을 num1이라는 변수에 넣는다
num2 = 99 --> 99의 값을 num2이라는 변수에 넣는다
name = 'bob' # 변수에는 문자열이 들어갈 수도 있고,
num = 12 # 숫자가 들어갈 수도 있고,
is_number = True # True 또는 False -> "Boolean"형이 들어갈 수도 있습니다.
a_list = []
a_list.append(1) # 리스트에 값을 넣는다
a_list.append([2,3]) # 리스트에 [2,3]이라는 리스트를 다시 넣는다
a_list의 값 : [1,[2,3]]
a_list[0]의 값 : 1
a_list[1]의 값 : [2,3]
a_list[1][0]의 값 : 2
a_dict = {}
a_dict = {'name':'bob','age':21}
a_dict['height'] = 178
a_dict의 값 : {'name':'bob','age':21, 'height':178}
a_dict['name']의 값 : 'bob'
a_dict['age']의 값 : 21
a_dict['height']의 값 : 178
people = [{'name':'bob','age':20},{'name':'carry','age':38}]
people[0]['name']의 값 : 'bob'
people[1]['name']의 값 : 'carry'
person = {'name':'john','age':7}
people.append(person)
people의 값 : [{'name':'bob','age':20},{'name':'carry','age':38},{'name':'john','age':7}]
people[2]['name']의 값 : 'john'
수학문제에서
f(x) = 2*x+3
y = f(2)
y의 값 : 7
참고: 자바스크립트에서
function f(x) {
return 2*x+3
}
파이썬에서
def f(x):
return 2*x+3
y = f(2)
y의 값 : 7
def sum_all(a,b,c):
return a+b+c
def mul(a,b):
return a*b
result = sum_all(1,2,3) + mul(10,10)
if / else 로 구성
def oddeven(num): --> oddeven이라는 이름의 함수를 정의한다. num을 변수로 받는다.
if num % 2 == 0: --> num을 2로 나눈 나머지가 0이면
return True --> True (참)을 반환한다.
else: --> 아니면,
return False --> False (거짓)을 반환한다.
result = oddeven(20)
def is_adult(age):
if age > 20:
print('성인입니다') --> 조건이 참이면 성인입니다를 출력
else:
print('청소년이에요') --> 조건이 거짓이면 청소년이에요를 출력
is_adult(30)
파이썬에서의 반복문은, 리스트의 요소들을 하나씩 꺼내쓰는 형태
fruits = ['사과','배','감','귤']
for fruit in fruits:
print(fruit)
사과, 배, 감, 귤 하나씩 꺼내어 찍힙니다.
fruits = ['사과','배','배','감','수박','귤','딸기','사과','배','수박']
count = 0
for fruit in fruits:
if fruit == '사과':
count += 1
print(count)
사과의 갯수를 세어 보여줍니다.
def count_fruits(target):
count = 0
for fruit in fruits:
if fruit == target:
count += 1
return count
subak_count = count_fruits('수박')
print(subak_count) --> 수박의 갯수
gam_count = count_fruits('감')
print(gam_count) --> 감의 갯수
딕셔너리 예제
people = [{'name': 'bob', 'age': 20},
{'name': 'carry', 'age': 38},
{'name': 'john', 'age': 7},
{'name': 'smith', 'age': 17},
{'name': 'ben', 'age': 27}]
모든 사람의 이름과 나이를 출력하기
for person in people:
print(person['name'], person['age'])
반복문과 조건문을 응용한 함수를 만들기
이름을 받으면, age를 리턴해주는 함수
def get_age(myname):
for person in people:
if person['name'] == myname:
return person['age']
return '해당하는 이름이 없습니다'
print(get_age('bob'))
print(get_age('kay'))
👉 패키지? 라이브러리? →
Python 에서 패키지는 모듈(일종의 기능들 묶음)을 모아 놓은 단위입니다.
이런 패키지 의 묶음을 라이브러리 라고 볼 수 있습니다.
지금 여기서는 외부 라이브러리를 사용하기 위해서 패키지를 설치합니다.
즉, 여기서는 패키지 설치 = 외부 라이브러리 설치!
같은 시스템에서 실행되는 다른 파이썬 응용 프로그램들의 동작에 영향을 주지 않기 위해,
파이썬 배포 패키지들을 설치하거나 업그레이드하는 것을 가능하게 하는 격리된 실행 환경 입니다.
프로젝트별로 패키지들을 담을 공구함
패키지 추가 설치하기(beautifulsoup4) - bs4
import requests
from bs4 import BeautifulSoup
타겟 URL을 읽어서 HTML를 받아오고,
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210829',headers=headers) << naver 영화 페이지
soup = BeautifulSoup(data.text, 'html.parser')
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210829',headers=headers)
HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
soup = BeautifulSoup(data.text, 'html.parser')
select를 이용해서, tr들을 불러오기
movies = soup.select('#old_content > table > tbody > tr')
movies (tr들) 의 반복문을 돌리기
for movie in movies:
movie 안에 a 가 있으면,
a_tag = movie.select_one('td.title > div > a')
if a_tag is not None:
a의 text를 찍어본다.
print (a_tag.text)
태그와 속성값으로 찾는 방법
soup.select('태그명[속성="값"]')
한 개만 가져오고 싶은 경우
soup.select_one('위와 동일')
Database의 두 가지 종류
RDBMS(SQL)
행/열의 생김새가 정해진 엑셀에 데이터를 저장하는 것과 유사합니다.
데이터 50만 개가 적재된 상태에서, 갑자기 중간에 열을 하나 더하기는 어려울 것입니다.
그러나, 정형화되어 있는 만큼, 데이터의 일관성이나 / 분석에 용이할 수 있습니다.
No-SQL
딕셔너리 형태로 데이터를 저장해두는 DB입니다.
고로 데이터 하나 하나 마다 같은 값들을 가질 필요가 없게 됩니다.
자유로운 형태의 데이터 적재에 유리한 대신, 일관성이 부족할 수 있습니다.
mongoDB - Atlas 가입
연결 준비하기
1) Allow Access from Anywhere 클릭 → Add IP address 클릭
2) Username, Password를 아래와 같이 입력 → Create Database User 클릭
3) Choose a connection method 클릭
mongoDB - Atlas 연결하기
pymongo 라이브러리의 역할
mongoDB 라는 프로그램을 조작하려면,
특별한 라이브러리, pymongo가 필요!
pymongo, dnspython 패키지 설치 후 잘 연결됐는지 테스트해보기
doc = {
'name':'bob',
'age':27
}
db.users.insert_one(doc)
DB연결하기 & 데이터 넣기 (insert_one)
'users'라는 collection에 {'name':'bobby','age':21}를 넣습니다.
db.users.insert_one({'name':'bobby','age':21})
db.users.insert_one({'name':'kay','age':27})
db.users.insert_one({'name':'john','age':30})
모든 결과 값을 보기 (find)
all_users = list(db.users.find({},{'_id':False}))
print(all_users[0]) # 0번째 결과값을 보기
print(all_users[0]['name']) # 0번째 결과값의 'name'을 보기
for user in all_users: # 반복문을 돌며 모든 결과값을 보기
print(user)
특정 결과 값을 뽑아 보기 (find_one)
user = db.users.find_one({'name':'bobby'})
print(user)
수정하기 (update_one)
db.users.update_one({'name':'bobby'},{'$set':{'age':19}})
user = db.users.find_one({'name':'bobby'})
print(user)
삭제하기 (거의 안 씀) (delete_one)
db.users.delete_one({'name':'bobby'})
user = db.users.find_one({'name':'bobby'})
print(user)
저장 - 예시
doc = {'name':'bobby','age':21}
db.users.insert_one(doc)
한 개 찾기 - 예시
user = db.users.find_one({'name':'bobby'})
여러개 찾기 - 예시 ( _id 값은 제외하고 출력)
all_users = list(db.users.find({},{'_id':False}))
바꾸기 - 예시
db.users.update_one({'name':'bobby'},{'$set':{'age':19}})
지우기 - 예시
db.users.delete_one({'name':'bobby'})
pymongo 기본 세팅
import requests
from bs4 import BeautifulSoup
from pymongo import MongoClient
client = MongoClient('mongodb+srv://test:sparta@cluster0.55vah.mongodb.net/Cluster0?retryWrites=true&w=majority')
db = client.dbsparta**
URL을 읽어서 HTML를 받아오고,
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=pnt&date=20210829',headers=headers)
HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
soup = BeautifulSoup(data.text, 'html.parser')
select를 이용해서, tr들을 불러오기
movies = soup.select('#old_content > table > tbody > tr')
movies (tr들) 의 반복문을 돌리기
for movie in movies:
a_tag = movie.select_one('td.title > div > a')
if a_tag is not None:
img 태그의 alt 속성값을 가져오기
rank = movie.select_one('td:nth-child(1) > img')['alt']
a 태그 사이의 텍스트를 가져오기
title = a_tag.text
td 태그 사이의 텍스트를 가져오기
star = movie.select_one('td.point').text
print(rank,title,star)