[Python] 데이터 수정에 유용한 함수들

Jihyun·2023년 10월 5일
0

데이터를 조회하는 법을 배웠으니 이제 데이터를 추가하고 삭제하고 변경하는 등, 데이터를 수정하는 방법을 배워볼 것이다. 데이터를 추가하고 삭제하고 변경할 때 도움이 되는 함수를 배워보자.

1. 데이터 추가하기

데이터를 추가할 때는 insert 함수를 사용하면 된다. 사용법은 다음과 같다.

  • df.insert(loc, column, value, allow_duplicates)
  1. loc : 삽입될 열의 위치
  2. column : 삽입될 열의 이름
  3. value: 삽입될 열의 값
  4. allow_duplicates: 중복 열의 삽입을 허용하는지 여부(기본값은 False)
# 새로운 칼럼 원하는 위치에 넣기
flight.insert(10,'duration2', flight['duration']*10)
flight.head()


duration2 column이 새로 추가된 것을 확인할 수 있다.

2. 데이터 삭제하기

데이터를 삭제할 때는 drop 함수를 사용하면 된다.
drop을 사용할 때는 axis=0 과 axis=1이 무엇인 지 알아야 한다.

  • axis = 1 : column data 제거
  • axis = 0 : index data 제거

df.drop(value, axis)

# drop을 사용하여 'price'데이터 제거하기
flight.drop('price', aixs=1)

# 첫 번째 행의 데이터 제거하기
flight.drop(index=0, axis=0)

# drop으로 제거한 columns를 영구적으로 제거하기
flight.drop('price', aixs=1, inplace=True)
# inplace=True를 사용하면 별도의 변수를 지정하지 않아도 바로 저장된다.

3. Column name 변경하기

column의 이름을 변경하기 위해선 rename 함수를 사용하면 된다.

df.rename(columns:{old_name: new_name})

# rename을 사용하여 column name 변경
flight = flight.rename(columns = {"airline" : "airline_name", "source_city": "departure_city"})
flight.head()

4. 데이터 정렬하기

데이터 분석할 때 원하는 데이터를 기준으로 정렬해야하는 경우가 생긴다. 이때 sort_values 함수를 사용하면 데이터를 쉽게 정렬할 수 있다.

df.sort_values(by = 'values', ascending=True)

ascending의 기본값은 True이고, 오름차순으로 정렬한다는 의미다. False가 될 경우 역순으로 정렬한다.

# sort_values를 사용하여 정렬
flight = flight.sort_values(by='Unnamed: 0', ascending=False) # Unnamed: 0을 기준으로 역순으로 정렬
flight.head()

flight = flight.sort_values(by='Unnamed: 0', ascending=True) # Unnamed: 0을 기준으로 오름차순으로 정렬
flight.head()
profile
혼자 공부하는 데이터분석

0개의 댓글