학습내용
pd.set_option('display.float_format', '{: , .1f}'.format) #소수점 첫째자리로 출력 변경
그래프
import matplotlib.pyplot as plt
import seaborn as sns
#선 그래프
sns.lineplot(x=x, y=predict, color = 'red')
#분포 그래프
sns.displot(data, kde = True) #kde 그래프 그려주는 것??
#scatter + regression line
sns.regplot(x,y)
#모든 변수쌍에 대한 scatter plot
pairplot(data, height = )
#상관관계 heatmap
sns.heatmap(df.corr(), #df.corr()[['price]] 처럼 특정 변수에 대해서 선택 가능
annot = True, #박스안에 correlation 표시
mask = mask, True인 곳 masking
fmt = '.1f',
linewidths = .5,
cmap = 'Blues');
LinearRegression
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
model.predict(X_test)
model.coef_ #regression 계수
model.intercept_ #regression 절편
#model에 들어가는 data들은 array 또는 DataFrame으로 들어가야함