num_train_epochs 10 > 20
per_device_train_batch_size 4 > 8
logging_steps 3 > 8
RTX3090 * 2 환경
학습시간 30분
training_args = TrainingArguments(
output_dir=output_dir, # 학습 중 생성되는 체크포인트 및 로그 파일의 저장 경로
per_device_train_batch_size=8, # 각 장치(CPU/GPU)당 학습에 사용될 배치 크기
gradient_accumulation_steps=4, # 기울기 업데이트를 하기 전까지 기울기를 축적할 단계 수. 늘리면 배치 크기 커짐.
num_train_epochs=20, # 전체 학습 데이터셋을 몇 번 반복하여 학습할지 지정하는 에포크 수
learning_rate=2e-4, # 모델 학습 시 사용될 학습률
save_total_limit=2, # 저장될 모델 체크포인트의 최대 개수. 이 개수를 초과하면 오래된 체크포인트가 삭제됨
logging_steps=8, # 학습 진행 상황(손실 등)을 로그로 기록할 단계 간격
bf16=False,
fp16=True,
report_to="none", # 학습 진행 상황을 보고할 외부 도구(예: TensorBoard, Weights & Biases)
weight_decay=0.01
)
{"messages": [{"role": "system", "content": "당신은 아이폰 전문가 챗봇입니다. 사용자의 질문에 답변해 주세요."}, {"role": "user", "content": "아이폰에서 다크 모드는 어떻게 설정하나요?"}, {"role": "assistant", "content": "'설정 > 디스플레이 및 밝기'에서 다크 모드를 선택할 수 있습니다."}]}
{"messages": [{"role": "system", "content": "당신은 아이폰 전문가 챗봇입니다. 사용자의 질문에 답변해 주세요."}, {"role": "user", "content": "아이폰에서 알림을 끄는 방법은?"}, {"role": "assistant", "content": "'설정 > 알림'에서 개별 앱의 알림을 비활성화할 수 있습니다."}]}
{"messages": [{"role": "system", "content": "당신은 아이폰 전문가 챗봇입니다. 사용자의 질문에 답변해 주세요."}, {"role": "user", "content": "아이폰 백업은 어디에 저장되나요?"}, {"role": "assistant", "content": "iCloud 백업은 애플 서버에, 로컬 백업은 컴퓨터에 저장됩니다."}]}
또한번 개소리 남발...
{"messages": [{"role": "system", "content": "당신은 아이폰 전문가 챗봇입니다. 사용자의 질문에 답변해 주세요."}, {"role": "user", "content": "아이폰에서 다크 모드는 어떻게 설정하나요?"}, {"role": "assistant", "content": "'설정 > 디스플레이 및 밝기'에서 다크 모드를 선택할 수 있습니다."}]}
개소리 남발222
{"messages": [{"role": "system", "content": "당신은 아이폰 전문가 챗봇입니다. 사용자의 질문에 답변해 주세요."}, {"role": "user", "content": "아이폰이 켜지지 않을 때 어떻게 하나요?"}, {"role": "assistant", "content": "충전 후 강제 재시동을 시도해보세요. 그래도 안 되면 서비스 센터에 문의하세요."}]}
개소리 남발33333333
{"messages": [{"role": "system", "content": "당신은 아이폰 전문가 챗봇입니다. 사용자의 질문에 답변해 주세요."}, {"role": "user", "content": "아이폰을 새 기기로 바꿀 때 데이터 이전은 어떻게 하나요?"}, {"role": "assistant", "content": "기기 간 전송이나 iCloud 백업 복원을 사용할 수 있습니다."}]}
자... Take #3 로...
학습량을 늘려서 일단 원래 질문에는 답변을 할 수 있게끔 했다.
질문 만드는 전략을 바꿔야 하나...