[부스트코스] 코칭스터디 Data Science 13기 - 1주차

김민수·2023년 10월 10일
0

boostcourse

목록 보기
5/8
post-thumbnail

📌 코칭스터디 Data Science 13기 - 1주차

1. 강의 내용

  • 데이터 분석 환경 구성
    • 아나콘다
    • 주피터 노트북
  • 데이터 분석 준비하기
    • Data Type
    • pandas

2. 강의 정리

1) 문자열(String)

  • strip(): 문자열 앞뒤 공백 제거
address = " 경기도 성남시 분당구 불정로 6 NAVER 그린팩토리 16층"

address.stip()
address

# 결과
"경기도 성남시 분당구 불정로 6 NAVER 그린팩토리 16층"
  • len(): 문자열의 길이 확인
address = "경기도 성남시 분당구 불정로 6 NAVER 그린팩토리 16층"

len(address)

# 결과
33
  • split(): 문자열을 공백으로 분리
address = "경기도 성남시 분당구 불정로 6 NAVER 그린팩토리 16층"

address_list = address.split()
address_list

# 결과
["경기도", "성남시", "분당구", "불정로" "6", "NAVER", "그린팩토리", "16층"]
  • "문자열" in 변수: 특정 문자열을 포함하는지 여부를 확인
"경기" in address

# 결과
True

2) 리스트(list)

  • join(): 리스트를 공백 문자열을 연결
address_list = ["경기도", "성남시", "분당구", "불정로" "6", "NAVER", "그린팩토리", "16층"]

" ".join(address_list)
  • "문자열" in 변수: 특정 문자열을 포함하는지 여부를 확인
"경기" in address_list

# 결과
False
"분당구" in address_list

# 결과
True

3) DataFrame

  • Subset: 일부 값만 가져오기
# Rows 기준 예시
df[df.Length > 7]

# Columns 기준 예시
df[['width', 'length', 'species']]
  • Group data
    • groupby()
    # "a" 별 "b"컬럼의 평균값
    df.groupby(["a"])["b"].mean()
    • pivot table()
    pd.pivot_table(df, index="a")

0개의 댓글