딥러닝이 어떻게 구현되는지에 초점을 맞춰 실습 예제를 수행해 보았습니다.
사용한 데이터셋은 Kaggle 이커머스 데이터셋입니다.
회귀 분석에 활용할 만한 컬럼을 Avg. Session Length
| Time on App
| Time on Website
| Length of Membership
이고, 이를 토대로 Yearly Amount Spent
를 예측해보도록 하겠습니다.
얼마나 많이 앱이나 웹을 이용하면 얼마를 지출하는지 예측하는 것입니다.
Kaggle | Linear Regression E-commerce Dataset
1.1. 모델과 데이터 불러오기
1.2. EDA, 시각화
1.3. 학습을 위한 입력 데이터와 가중치 설정
1.4. 모델 학습
2.1. PyTorch 모델 설정
torch.nn.MSE()
이용한 손실함수 설정3.a. 2층(2개의 레이어)으로 구현한 모델
self.layer1 = torch.nn.Linear(4, 10) # 4개의 입력값을 받아 10개로 출력합니다.
self.layer2 = torch.nn.Linear(10, 1) # 10개의 입력값을 받아 1개로 출력합니다.
3.b. 2개의 레이어를 행렬곱 연산하여 가중치를 도출
비선형성을 추가하면 더 복잡한 표현이 가능
4.a. ReLU 활성화 함수
4.b. Sigmoid 활성화 함수
[출처 | 딥다이브 Code.zip 매거진]