R-simple linear regression

be1le·2022년 4월 30일
4

ML-R

목록 보기
3/3
post-thumbnail

이번 시간에는 simple linear regression을 python이 아닌 R로 구현해보려 한다.

Set As Working Directory


R studio에서 오늘 실습에 사용할 Salary.csv파일을 선택후 더보기를 눌러 Set As Working Directory로 설정을 완료하면

콘솔창에 이렇게 표시가 됨과 동시에
이렇게 csv파일이 열리게 된다.

Splitting the dataset

데이터셋 분할을 하기위해선믄 우리는 caTools를 가져와야 한다는 것을 지난번 R 실습에서 배웠다 해당 flow그대로 진행을 해본다면

여기까지가 분할을 해주는 과정이고

후에 이처럼 작성하면 우리는 훈련데이터는 TRUE로 검증 데이터는 FALSE로 표시된다는 것을 알 수 있다.

feature scaling

이 작업은 R에서 이용 중인 단순 선형 회귀 패키지가 알아서 해준다. 그러니 우리는 신경쓰지 않아도 된다.

fitting

regressor = lm이라고 코드를 적은후 f1을 눌러보면

이와같은 설명을 볼 수 있는데 argument를 보면

  • 'formula'
  • 종속 변수
  • 독립 변수

    이렇게 입력을 해주고 두번째 argument인 data를 입력해 주면 된다.

    이처럼 입력후 실행을해보면


regressor가 표시되기 시작한다.

콘솔 영역에
summary(regressor)이처럼 입력하면

이렇게 단순 선형 회귀 모델에 대한 정보가 표시된다.

Predicting the Test set results


이처럼 입력하면

y_pred가 생성되는 것을 확인할 수 있다.

콘솔창에
y_pred 를 입력해보면

이 숫자가 나타내는 건 테스트 세트의 관측값 10건에 상응하는 임금 예측이 된다.

profile
그저 그런 개발자가 되지 않겠습니다.

0개의 댓글