작업 1유형 : nba 선수 능력치 데이터

SOOYEON·2022년 5월 27일
0

빅데이터분석기사

목록 보기
17/36

Q2.

Pos 컬럼은 포지션을 의미한다. 전체 선수 중 최소나이대의 선수들을 필터하고 그들 중 가장 많은 포지션은 무엇인지 확인하라

# s
df['clf'] = (df['Age']//10)*10
df['clf'].value_counts().index[0]
df[df['clf']==20]['Pos'].value_counts().index[0]

#
df[df.Age==df.Age.min()].Pos.value_counts().index[0]

Q3.🌟

선수들의 이름은 first_name+ 공백 + last_name으로 이루어져 있다. 가장 많은 first_name은 무엇이며 몇 회 발생하는지 확인하라

# .str
df['first'] = df['Player'].str.split(' ').str[0]
df['first'].value_counts().index[0]

#
result= df['Player'].str.split().str[0].str.lower().value_counts().head(1)
print(result)

Q5.

G컬럼은 참여한 경기의 숫자이다. 각 팀별로 가장 높은 경기참여 수를 가진 선수들의 경기 참여 숫자의 평균을 구하여라

# s
df.groupby('Tm')['G'].max().mean()
# 
result = df.sort_values(['Tm','G']).groupby('Tm').tail(1).G.mean()
print(result)

Q9.

평균나이가 가장 젊은 팀은 어디인가

df.groupby('Tm')['Age'].mean().sort_values().index[0]

0개의 댓글