LG Aimers 2기를 마치며🫡

그래도 아무튼 개발자·2023년 3월 28일
0

AI

목록 보기
1/1
post-thumbnail

LG에서 AI 인재 양성을 위해 청년 대상으로 LG Aimers라는 교육 프로그램을 실시하는데, 1기 때 꽤나 성공했는지, 2기를 뽑는다고 했다. 비록 나는 AI 관련 지식이 크게 없는 편이지만, 알아두면 좋겠다는 마인드로 지원하였고, 합격해서 LG Aimers 2기 활동을 시작하였다...!

혹시라도 3기 지원을 생각한다면 Python은 앵간히 할줄 알아야한다.. 교육 대상에 C C++ Java 다써놨는데 다 필요없다 Python만 잘하면된다. 쓰는 언어도 Python밖에 없다ㅋㅋㅋ

Phase1에서는 명문 교수진 분들이 나오는 AI 인강을 듣는다. 다들 스펙 장난없으시고... 강의질도 너무 좋다... 내가 이해를 못할뿐..

이후 Phase2에서는 팀 또는 개인으로 온라인 해커톤을 진행한다. 해커톤은 Dacon에서 진행되었다. 여기서 만든 모델의 점수가 baseline만 넘으면 수료처리가 되지만, 그 중에서도 상위 30팀은 Phase3로 진출하게 되며, 오프라인 해커톤을 실시하게 된다!

점수는 Public 스코어와 Private 스코어로 나뉘는데, Public은 전체 테스트데이터 중 30%만 제공했을 때의 결과점수이고, Private은 전체 데이터 모두 주어졌을 때의 결과점수이다. 온라인 해커톤 기간 동안은 Public 데이터로만 테스트를 해야한다...
따라서 Public 점수가 잘나왔고, 수료기준이 넘었다 하더라도 결과는 모른다는말씀... 이게 너무 잔인했다..

우선 그래도 수치로 표현되는게 Public 스코어 말고는 믿을 수 있는게 없으니 Public을 최대한 올리는 쪽으로 선택하였다.
0.5495만 넘으면 되니까...public 점수를 0.7 가까이 맞아버리면 괜찮겠지라는 마인드를 가지고... 팀플을 했는데

private 점수 발표에서 26등을 했다... public에서 0.659정도를 만들면서 120등이었는데 갑작스러운 떡상..
윗 순위에 있던 분들이 과적합으로 인해 Private에서 급격하게 하락한 것으로 보인다.

참고로 코드는 외부에 적으면 안된다는 이야기를 들어서 코드는 작성하지 않았다.

간단하게만 말하면 학습모델로 RandomForest와 LGBMClassifer, XGBClassifier 3가지를 사용하여 구현하였다💪

암튼 운좋게 Phase3까지 가게되는데...
Phase3는 오프라인으로 진행되며, 3월 25-26동안 1박2일로 LG 인화원에서 진행되었다.
500팀이 넘게 있던 온라인에서 30팀으로 줄어들었으니...다들 열정적으로 해커톤에 임하고, 밤새는 사람들도 정말 많았다...

이번에도 우리팀은 Public 스코어를 올려놓는 방식으로 진행하였다.
Scaler를 사용하여 정규분포를 이용하였고, 결측치가 50%가 넘는 컬럼들을 아예 제거를 해버리는 등 어떻게든 최대한 점수가 잘나오게 하였다. 이후 하이퍼파라미터까지 튜닝하면서 결국에는

위 사진과 같이 미친 점수를 기록하면서 Public스코어 2등을 기록하였다. 이정도 상위권을 찍어놨으면 아무리 과적합이 생겨도 상위권울 유지할 수 있을 것만 같았다.

하지만 Private 스코어는...정말 아무도 모른다.

엄청난 낙폭을 보여주면서 멸망해버렸다... 정말이지 초점을 Public스코어에 집중을 해버린 탓에 엄청난 과적합이 발생한 것으로 보인다... 좋은 Public 점수를 만들어냈기에 더욱 아쉬웠던 나의 첫 해커톤이 이렇게 마무리되었다.


운좋게 이런 좋은 기회가 생겨서 이렇게 오프라인 해커톤도 참여하게 되었다. 해커톤 자체가 처음인데, 점수가 잘나와서 1박2일 오프라인까지 경험했으니... 개인적으로는 아주 만족스러운 경험이었다. 다음에 또 이러한 관련 일을 하게 된다면 이번 경험이 크게 도움이 될 것 같은 생각이 든다🫡🫡

0개의 댓글