Coaspe
로그인
Coaspe
로그인
New 2 - Data Science
Coaspe
·
2021년 11월 9일
팔로우
0
0
Data Science
목록 보기
5/5
1. sns.despine()
그래프에서 테두리 삭제하는 역할
2. Skewness, Kurtosis
1. Skewness
왜도라는 뜻으로 분포의 비대칭성을 나타내는 척도이다.
왜도가 양수이면 Data의 중심이 정규 분포보다 왼쪽으로 치우쳐져 있고, 꼬리는 오른쪽으로 길어지게 표현된다.(Right-skewed)
왜도 값이 -2~2 정도의 치우침은 왜도가 크지 않다고 판단한다.
2. Kurtosis
첨도라는 뜻으로 도수 곡선의 최빈치를 중심으로 하는 부분의 완만함, 뾰족함의 정도를 나타내는 수치이다.
정규분포의 첨도는 0이며, 첨도가 0보다 크면 정규분포보다 더 뾰족한 모양인 고첨이 되고, 0보다 작으면 정규분포보다 낮아지는 저첨이 된다.
3. plt.subplots_adjust()
subplots의 layout을 바꾼다.
4. sns.distplot()
Distribution plot과 histplot이 섞여있다.
5. Dataframe.corr()
Corelation을 갖고 있는 Dataframe을 반환한다.
6. sns.heatmap()
Correlation에 대한 heatmap이다.
7. Skewed distribution은 np.log1p()같은 함수로 normalized 될 수 있다.
8. round(data[column].isnull().mean()*100, 2)
column의 null 값을 %로 구하는 방법
9.ax.xaxis.grid()
위의 그래프의 빨간색 선을 의미한다. (color='r')
10. features[column] = features.groupby('Neighborhood')['column'].transform(lambda x: x.fillna(x.median()))
이웃으로 grouping한 후에 중간값으로 NaN 값을 채우기
11. pandas.DataFrame.update()
나머지는 유지하고 해당 column을 교체한다.
12. sns.boxplot()에서 x와 y를 명시하지 않으면 y는 data의 column이고 x는 값을 의미한다.
Coaspe
https://github.com/Coaspe
팔로우
이전 포스트
New 1 - Data Science
0개의 댓글
댓글 작성