LinAlgError: Singular matrix
회귀분석에서 계수를 구할 때, 위와 같은 방법으로 를 추정할 수 있다.
보통 Singular matrix 오류는 이 과정에서 발생한다. 케이스를 나누어 좀 더 자세히 설명하면,
웬만한 경우는 전부 역행렬을 구할 수 없는 경우에 위와 같은 오류가 발생한다.
결측치를 제거하거나 이상치를 제거하는 방법은 너무나도 많기에 해당 게시글에선 스킵한다.
2번과 3번의 경우를 묶은 이유는 2번의 의미가 3번의 의미를 함축시키고 있기 때문이다.
data = {
'var1' : [1,1,1,1,1],
'var2' : np.arange(0, 10, 2),
'var3' : np.random.rand(5),
'y' : ...}
import matplotlib.pyplot as plt
for col in data.columns:
plt.figure()
data[col].hist(bins = 30) #bins 는 막대가 이루고 있는 크기
plt.title(column)
fig.show()
plot을 통해 한 값으로만 이뤄진 그래프가 보인다면, 이 녀석을 제거하거나 후처리를 통해 값을 변경하고 진행하면 된다.