220514_엑셀, python 기초

juyeon·2022년 5월 14일
0

끄적이기

목록 보기
3/13

데이터 분석이란?

: 1주차 - 엑셀을 이용해 데이터분석을 맛보고, 본격적으로 파이썬 기초 문법과 웹 스크래핑(크롤링) 하는 방법에 대해 배워봅니다!

  • 상관분석
    : 독립변수, 종속변수간 상관을 분석.
    사실.. 넘 쉬운 내용이라..패스!

  • 구글 스프레드 시트에서 기초 통계 분석
    : 'analysis toolpak'

구글 colab

: python만 이용 가능!
따로 개발 환경을 위한 셋팅을 하지 않고도 언제든 파이썬을 이용 가능하다.

: https://colab.research.google.com/

'''
여러 줄의 주석이 필요하다면 이렇게
따옴표 3개를 연속으로 적고
그 다음에 주석을 적은 뒤에
다시 따옴표 3개로 닫아줍니다.
'''
"""
쌍따옴표도 가능
"""
3 + 5
#변수의 type 확인
a=5
type(a)

int #Integer(정수):정수형

b=5.3
type(b)

float #부동소수점(floating point): 실수형

c='안녕하세요'
type(c)

str #String(문자열): 문자형

list

list1 = [1, 2, 3, 4, 5]
list2 = ['a', 'b', 'c', 'd', 'e']
print(type(list1))
print(type(list2))

<class 'list'>
<class 'list'>

indexing

: list 내의 원소의 위치를 표현하는데, 0부터 카운트 한다.

list = ['a', 'k', 'j', 'b', 's', 'v', '!']
# 0번 위치의 원소 호출. 실제로는 첫번째 원소
list[0]

'a'

append, extend

  • append:리스트에 원소를 추가
  • extend: 리스트에 또 다른 리스트를 추가
list_1 = [1, 2, 3, 4, 5]
list_1.append(155)
list_1

[1, 2, 3, 4, 5, 155]

list_2 = ['a', 'b', 'c']
list_1.extend(list_2)
print(list_1)

[1, 2, 3, 4, 5, 155, 'a', 'b', 'c']

for문(반복문)

  1. for문 끝에 : (콜론)을 꼭 붙여야 한다.
  2. 반복해서 실행될 코드는 들여쓰기(indentation)을 해주어야 한다. 이때 들여쓰기를 하는 방법은 탭(Tab) 키를 한 번 누르거나 스페이스바(Spacebar)를 4번 사용할 수 있다.
  • list와도 연계해서 사용 가능
for i in range(0, 5): # 맨 끝에 :(콜론)을 사용하였다.
  print(i,'번 반복할게요~') # print 앞에 들여쓰기를 해주었다.
  
0 번 반복할게요~
1 번 반복할게요~
2 번 반복할게요~
3 번 반복할게요~
4 번 반복할게요~

비교연산자

# 5와 7은 다른가요?
5 != 7

True

if문(조건문)

  • for문의 조건과 동일
if c == 8:
	# 조건이 참이라면 실행
  print('더했더니 8입니다! 짝짝!')
else: # else 뒤에는 조건문이 없어야함!
	# 조건이 거짓이라면 실행
  print('더한 값이 8이 아닙니다! 틀렸습니다!')
  
  더했더니 8입니다! 짝짝!

elif

score = 85

if score >= 90:
print('학점이 A입니다.')
elif score >= 80:
print('학점이 B입니다.')
else: # else 뒤에는 조건문이 없어야 함!
print('80점보다 낮아서 학점이 C입니다.')

학점이 B입니다.

함수

def volume(width, height, length):
  return width * height * length # 코드 앞에 들여쓰기를 해줍니다.
volume(5, 8, 2)
  
80

return 대신에 print만 쓴다면?

: 모든 함수가 반드시 값을 return해야만 하는 것은 아니다. return문을 사용하지 않고, 함수를 작성하면 해당 함수는 값을 return하지 않는다.

def add(a, b): 
  print(a,'하고',b,'를 더하면',a+b,'입니다.')
add(3, 4)

3 하고 4 를 더하면 7 입니다.
  • 그러나, return 한 값을 변수에 저장할 수 없다.
var = add(3, 4)

3 하고 4 를 더하면 7 입니다.

print(var)

None #출력되지 않는다.
  • return 하도록 함수를 만들면,
def add(a, b):
  print(a,'하고',b,'를 더하면',a+b,'입니다.')
  return a + b
  
var = add(3, 4)
print(var)

3 하고 4 를 더하면 7 입니다.
7

class

-> 아직 이해하지 못했으므로, 추후 수정하자!

  • class
  • 인스턴스(객체)
class Monster():
    hp = 100
    mp = 10

    def damage(self, attack):
        self.hp = self.hp - attack

monster1 = Monster()
monster1.damage(120)

monster2 = Monster()
monster2.damage(90)
# 객체
monster1 = Monster() 
monster1.damage(100)

예외처리: try, except문

try:
	print(a/b)
except:
	print('0으로는 나눌 수 없어요!')
    
a = 10
b = 0
print(a/b)

0으로는 나눌 수 없어요!

package, pandas

패키지 (package)

: 누군가가 이미 만들어놓은 함수, 클래스 덩어리를 말한다. 우리가 어떤 기능을 직접 구현하지 않더라도, 바로바로 사용하라고 누군가가 이미 기능을 만들어놓은 것! import 라는 명령어를 사용해서, 그저 가져오기만 하면 바로 사용할 수 있다.

판다스(Pandas)

: 파이썬 데이터 분석을 위한 필수 패키지 중 하나. 그중 Pandas가 제공하는 표 (테이블) 형태의 구조인 데이터프레임은 주로 데이터를 읽어서 저장하고, 연산을 위해 많이 사용된다.

#import pandas as '사용자가 정한 이름'
import pandas as pd
profile
내 인생의 주연

0개의 댓글