TIPS

wandajeong·2023년 6월 9일
0

Data Handling

목록 보기
14/15
  • 데이터 샘플링
import random
random.seed(2023)

df_spl = df.sample(n=100, replace=False)
  • tqdm
# version에 따라 total 추가 여부 다름 
for i, row in tqdm(df.iterrows(), total = df.shape[0]):
  • reduce
    • 주어진 함수를 반복적으로 적용하여 시퀀스의 원소들을 하나의 값으로 축소
from functools import reduce

words = ["Hello", " ", "world", "!"]

# Using reduce to concatenate words
concatenated_string = reduce(lambda x, y: x + y, words)

print(f"Concatenated string: {concatenated_string}")
# >> "Hello world!"
# 문자열, 숫자 모두 가능 
  • 특정 값 연속구간 찾기(dataframe)
df['flag'] = df['status'] =='LU'
df['group'] = (df['flag'] != df['flag'].shift()).cumsum()
groups = df[df['flag']].groupby('group')
for name, group in groups:
	print(f"Group {name}: Start - {group.index[0]}, End - {group.index[-1]}")
profile
ML/DL swimmer

0개의 댓글