본선 선발
예선 100팀 응모, 그중 30팀 선발(각 과제별 10팀)
수상자 혜택
수상 일정
- 과제별 3팀 수상
- 10월 13일 송파 소피텔 호텔 개발자 컨퍼런스에서 시상식
- 1등 300만원, 2등 200만원, 3등 100만원
KT 입사 지원시 우대 혜택
- 모든 채용 공고 관련해서 1회에 한해 서류전형 면제
- KT 그룹사의 채용에서는 혜택이 적용되지 않음!!
- 학생(대학원)은 연구비/등록금 지원, 졸업 후 KT 입사 시 의무복무기간은 두배
본선 과제 안내
공통사항
- 개별 개발환경 사용
- 결과물이 예선과 달리 ppt 심사가 있음
- 예선 모델의 고도화 진행
- 정량평가 70%, 정성평가 30%
- ppt 심사: 9월 30일 오전 9시~
과제 2
- 우선 accuracy만 보는게 맞음
- 낙찰 실패는 나스미디어 외 다른 업체에서 낙찰 됐다고 생각하면 되나요?
- 보통 같은 시간대에 여러건의 낙찰성공이 있었는데, 한번의 경매에서 일어난 것인가요?
- 낙찰 성공 로그는 한번의 경매에서 이루어진것. 즉 매번 다 다른 경매
- 대분류와 소분류에 대해서 여러가지가 있는 것이 있었는데 하나의 제품이 여러 분류에 포함이 되는 건가요
- 카테고리는 대분류 소분류. IAB 분류. 한 제품은 여러 분류에 포함될 수 있지만, 우리가 받은 데이터는 한 데이터는 한 카테고리만 분류됨.
- Second Price 방식으로 낙찰이 진행되기 때문에
낙찰에 성공한 경우 AX_BidPrice보다 SSP_WinPrice 이 더 작아야 한다고 이해했는데, 실제 데이터를 분석해보았을 때 낙찰 성공 시 AX_BidPrice와 SSP_WinPrice 값이 같은 경우가 있었습니다. 이러한 경우는 정산 과정의 문제에 의한 것인가요?
- 해당 경매의 입찰자가 한명인 경우. 즉 두번째로 할만한 사람이 없었기 때문.
- 또는 다른 경우.. 여튼 잘못된 정책은 아님
- first price 기준: 제일 높게 단가를 써낸 사람의 금액으로 낙찰
- second price 기준: 제일 높게 단가를 써낸 사람을 낙찰시키고, 두번째로 높게 단가를 써낸 사람의 금액으로 낙찰
- IAB 카테고리에서 결측값은 26개의 대분류에 포함되지 않은 것인지 궁금합니다
- 결측치는 open rtb 상에서 트래픽이 서로 전송이 되면서 채워넣는건데, 이게 비워있으면 IAB 카테고리에 나타나지 않을 수 있음.
- 즉, DSP에서 광고가 보내질 때 그 부분을 채워서 보내지 않은 것
- 모델 학습 단계에서 시간이 많이 소요된다고 감점 요소가 되지는 않음. 그러나 성능 재현 단계에서 어려움이 있을 수 있으므로, 개발 환경에 대해서 자세하게 적어놓자.
- 본선 진출팀의 성능 차이가 크게 나지 않기 때문에 랜덤 시드를 꼭 고정해서 재현될 수 있도록 하자.
- 모델 학습에 있어서 코랩은 램 초과가 많이 일어나는데 주피터는 램 초과는 일어나지 않는데 시간이 많이 발생이 되는데 주피터로 작성해서 제출해도 되나요?
YES
- 매체 ID, 애드유닛 ID, 사용자 등을 최빈치등으로 범주화 시킨 경우가 있던데. 이건 도메인에서 중요한거라서.. 실격사유는 아닌데 조심하자.
- accuracy만 올리기 위해서 스무싱한다던가 그러지 말고.. 데이터 흐름을 이해하고 모델의 사용성에 대해서 생각하고 연구개발 해보자
Data Leakage
- test를 합쳐서 인코더 만들면 안되고
- test 데이터의 통계량을 사용해서 하면 안됨
소감..
- 이왜진, 왜 본선 진출한거지?! 모델 튜닝도 안했는데?!
- KT에서 진행되는 공모전이라서 그런지, 매니저님들이 홍보를 해서 그런지, 에이블러들이 반절은 되는거 같다..?