흡연자와 비흡연자 각각 charges의 상위 10% 그룹의 평균의 차이는?
# smoker group 별 상위 10% charges
yes_10 = df[df.smoker =='yes'].charges.quantile(0.9)
no_10 = df[df.smoker =='no'].charges.quantile(0.9)
# smoker group 별 상위 10% charges + smoker group 별 charges 평균
mean_yes = df[(df.smoker =='yes') & (df.charges >= yes_10)].charges.mean()
mean_no = df[(df.smoker =='no') & (df.charges >= no_10)].charges.mean()
answer = mean_yes - mean_no
print(answer)