후기
수업량이 너무 방대해서 어디서부터 어디까지 해야할지 기억범위가 너무 넓어서 막막한 느낌이 들었다
0부터 14사이 100개의 수
-- white, whitegrid, dark, darkgrid
boxplot
swarmplot
lmplot
heatmap
sns.heatmap(data=flights, annot=True, fmt="d"
data=flights --> 데이터는 flights 사용
annot=True --> 그래프 내부에 수치를 표시해라
annot=False --> 그래프 내부에 수치를 표시하지 말아라
fmt = "d" --> 그래프에 표시하는 데이터를 'd'정수로 해라
fmt = "f" --> 그래프에 표시하는 데이터를 'f'실수로 해라
pairplot
기본 style
sns.set_style("ticks")
(ticks style)
sns.pairplot(iris, hue="species")
(iris의 species컬럼을 이용한 hue option)
lmplot
(용어 변경 size --> height로 변경)
sns.lmplot(
x="x", y="y",
data=anscombe.query("dataset == 'I'"),
order=1
ci=None,
height=7,
scatter_kws={"s" : 50})
# ci -> 신뢰구간선택
# scatter _kws = {"s" : 50} -> scatter점 사이즈 50으로
# order=1 or 2 -> 직선곡률
( import & 한글오류 작업 )
(kind종류 : "scatter", "kde", "hist", "reg")
-- '검거' 컬럼을 기준으로 '각 검거율' 비교
-- '검거' 컬럼을 기준으로 '각 범죄' 비교
# 검거율 heatmap
# '검거' 컬럼을 기준으로 정렬
def drawGraph():
# 데이터 프레임 생성
target_col = ["강간검거율", "강도검거율", "살인검거율", "절도검거율", "폭력검거율", "검거"]
crime_anal_norm_sort = crime_anal_norm.sort_values(by="검거", ascending=False) # 내림차순
#그래퍼 설정
plt.figure(figsize=(10, 10))
sns.heatmap(
data=crime_anal_norm_sort[target_col],
annot=True, # 데이터값 표현
fmt="f", # d: 정수, f: 실수
linewidths=0.5, # 간격설정
cmap="RdPu",
)
plt.title("범죄 검거 비율(정규화된 검거의 합으로 정렬")
plt.show()
drawGraph()
linewidths=10 # 간격설정