[DATA] 파이썬으로 시작하는 데이터 사이언스 - 1주차

Mini·2022년 10월 31일
0

데이터분석

목록 보기
1/2
  • Anaconda란?
    • 가상개발 환경
    • 하나만 설치하면 파이썬 관련된 생태계를 사용할 수 있음.
  • 주피터 랩 vs 주피터 노트북

    • 주피터 랩 : 하나의 브라우저로 여러개의 탭을 열 수 있음.
    • 주피터 노트북 : 하나의 브라우저에 하나의 주피터 노트북이 열림
      • interactive 함 -> 결과를 바로 확인할 수 있음.
      • 마지막 줄을 출력해줌.
  • 마크다운

    • 코드와 함께 문서화를 할 수 있음.
  • 주피터 노트북 단축키

    • shift + enter -> 셀이 실행, 커서가 다음셀로 이동
    • ctrl + enter -> 셀이 실행, 커서는 이동 x
    • enter 키 누르면 다시 편집상태로 돌아옴.
    • esc 를 누르고
      • a키 -> 위에 셀 추가
      • b키 -> 아래에 셀 추가
      • dd키 -> 셀 삭제
      • m키 -> 문서 셀로 변경
      • y키 -> 코드 셀로 변경
  • view의 toggle line number -> 줄 수 볼 수 있음.

  • nbextension 설치법

  • python 기초

    • import this
    • 파이썬의 철학 담겨 있음.
      • boolean -> True / False
        * 명시적인 것이 암시적인 것 보다 낫다.
    • lower( ) -> 소문자로
    • upper( ) -> 대문자로
    • 파이썬 들여쓰기 -> tab 키 또는 스페이스바 4번
    • enumerate -> 인덱스 번호와 원소를 같이 가져올 수 있음.
# enumerate -> 인덱스 번호와 원소를 같이 가져올 수 있음.
for i,val in enumerate(lang):
        print(i,val)
# 문자열 나누기, 기본값 공백        
address_list = address.split("시") 
address_list    
# 특정 문자열로 시작하는지 여부
address.startswith("성남") 
# 문자열 합치기
" ".join(address_list) 
  • Pandas
  • Panel data system 의 약자
    • panel data -> 행과 열로 된 데이터
    • 엑셀에 비해 대용량의 데이터를 빠르게 처리할 수 있음.
  • 10 miutes pandas 따라해보기 -> 한국어 번역 문서 https://dataitgirls2.github.io/10minutes2pandas/
  • pandas cheet sheat 참고해보기
  • 데이터 프레임
#데이터 프레임 (2차원)
df = pd.DataFrame({
     "a" : [4,5,6],
     "b" : [7,8,9]  },
     index = [1,2,3])

df
#시리즈 데이터
df["a"] 
#데이터 프레임
df[["a"]] 
  • pivot vs pivot table
    • pivot -> 형태만 바꿈
    • pivot table -> 값의 연산 가능

0개의 댓글