# competition

33개의 포스트
post-thumbnail

[공모전 후기] k-ium 의료 인공지능 경진대회 2회 참가 후기

개요 😊참가 경위 😫 AI model 개발 공모전이 하고 싶다... 이전까지 창업 경진대회나 비즈니스 아이디어 경진대회를 위주로 공모전을 수행해오다보니.. 이제 다시 AI model 개발 공모전이 하고 싶어졌다. 이제야 겨우 pretrained model이든, 아예 쌩으로 layer를 쌓든 해서 AI model 개발을 할 수 있다고 말할 수 있는 수준이 됐는데 이대로 그냥 졸업하기에는 아까웠다. 이왕 교내 AI 동아리 회장도 하게 된 거 경험을 더 쌓아보자! 싶어서 평소에 주로 공부해오던 Image deep learning 관련 공모전이 없을까 찾아보았다. 그러다가 마침 공모전 팀 매칭 오픈 카톡방에서 이 대회를 봤고, 지난 번에 의학영상처리 과목도 수강했겠다 바로 같이 하자고 연락을 넣었다. 🟥 대회 설명 대회 주제: 주어진 뇌 혈관 조영술 이미지를 기반으로 뇌 동맥류의 유무와 위치를 판별하는 AI 알고리즘을 개발해라 참가 자격: 대학(원

2023년 7월 18일
·
0개의 댓글
·
post-thumbnail

[CV] YOLOv8 + MLFlow For Beginner

🌷 학습 중 정리한 내용으로 문제가 있다면 메일(jnw__@네이버)로 연락 부탁드립니다. :D > > Reference > - filot님이 공유해주신 YOLOv8 코드 > - Ultralytics Document 00. 개요 > Reference > Baek Kyun Shin님의 논문 리뷰 - YOLO(You Only Look Once) 톺아보기 You Only Look Once라는 이름의 YOLO 한 번의 Convolution Network로 이미지의

2023년 6월 2일
·
0개의 댓글
·
post-thumbnail

[국방 AI 부문 MINI 경진대회] 공정 프로세스 최종 품질값 예측

대회 설명 / 링크 공정 프로세스 최종 품질값 예측 이번 경진대회의 목표는 일정 시간별로 제품이 생산되는 공정에서 생산된 제품이 어떤 측정치를 가질지를 회귀 모델을 통해 예측하는 것이다. 본 프로젝트에서 사용한 데이터셋은 여러대의 기계를 통해 제품을 생산하는 공정에서 각 기계의 각 시간별 상태와 해당 상태에서 생산된 제품의 측정치로 구성되어 있다. 이를 이용하여 임의의 시간에서 임의의 기계 상태가 주어졌을 때 생산된 제품의 측정치는 어떻게 나올 것인지를 예측하는 모델을 총 2개 만들어야 했다. 생산 공정 과정은 아래와 같다. Machine 1, 2, 3에 해당하는 3개의 기계가 병렬적으로 동작하

2023년 4월 29일
·
1개의 댓글
·
post-thumbnail

2022 UOS 서울시 지역구별 따릉이 대여수 예측(Dacon)

대회 설명 2022 UOS 서울시 지역구별 따릉이 대여수 예측 대회 진행 과정 SSDC-KATUSA ML/DL 팀 멤버 2명과 함께 진행했다. 일과 이후의 시간과 주말 외박 시간을 활용하여 대회 준비를 했다. 물론 구내식당 식수인원 예측 경진대회도 시계열 관련 대회였지만, 이번 대회는 예측 기간인 2022년의 데이터를 학습에 사용할 수 없다는 점에서 더 난이도가 높았다. 시계열을 공부해본적이 없어서 처음부터 여러 실수를 했다. 날씨, 지하철 데이터 등 여러 외부 데이터를 활용하여 예측을 진행하기 위해 데이터를 준비했는데, ARIMA와 FBProphet과 같은 시계열 모델들은 x와 y 데이터만 입력을 받았다. 그래서 XGBOOST, LSTM과 같은 모델들을 사용해보려고 했으나 외부 데이터를 사용할 수 없기 때문에 시계열을 위한 모델을 사용해야겠다는

2023년 4월 29일
·
0개의 댓글
·
post-thumbnail

level1-STS(Semantic Textual Similarity) 대회 회고

개요 > 평화롭던 강의 기간은 끝나고 첫 level1 기초 대회(STS)가 마무리 되었다. 2주 간의 짧은 기간동안 진행된 리더보드 형 대회로 많은 걸들을 배운 기간이였다. 배운 것들을 문서화해서 정리하는 것이 무엇보다 중요하단 말을 듣고 빠르게 달려왔다. Alt Text 남는게 참 많은 대회였던 것 같다. 부끄럽지만 VScode를 제대로 써먹은 것도 처음이고(전까진 ipynb 파일 하나로 모든 처리를 다했었다) 코드를 모듈화해 CLI 환경에서 작동시킨다거나 ssh 서버를 받아와서 구동한다거나 wandb로 실험관리를 한다거나... 모든 발걸음이 처음이라 새로운 것을 배운다는 설렘으로 가득찬 2주 였다! 첫 기초 대회의 주제는 STS, Semantic Textual Similarity로 두 문장 간 의미적 유사도를 0~5점 사이의 실수로 예측하는 tas

2023년 4월 26일
·
0개의 댓글
·
post-thumbnail

LG Aimers: 스마트 공장 제품 품질 상태 분류 AI 해커톤

Terminology 결측치(Missing Value) : 데이터에 값이 없는 것 NA 또는 Null로 표현 이번 대회에서는 결측치가 모두 NaN로 채워져있었음 Not A Number(NaN) np.nan : dataframe에서 일반적으로 결측치를 표현하는 형식 Imputation(대치법) of Missing Value Single Imputation MICE Imputation https://velog.io/@jee-9/%EA%B2%B0%EC%B8%A1%EC%B9%98Nulls-%EC%B2%98%EB%A6%AC%EC%97%90-%EB%8C%80%ED%95%B4%EC%84%9C-Imputation-Single-MICE Imputation 0으로 fillna | case | Macro F1 score | |:----------|:----------:| |0으로 fillna(Baseline)|0.5495720225 |모두

2023년 2월 17일
·
0개의 댓글
·
post-thumbnail

2022 AI 학습용 소방 데이터 해커톤

📌 대회 📖 대회에 대한 내용 앞서 말한 해커톤 기획서와 서류들이 1차적으로 예선을 통과하여 2차로 발표를 하게 되었다. 📋 심사배점 > 아이디어명(20) : 제안한 아이디어 명칭의 적절성 제안 배경(20) : 경제적, 산업적, 사회적 배경의 적절성 기술성(20) : 제안 배경에 맞는 적절한 기술의 적합성 실현 가능성(20) : 구현 가능 및 타당성 사업성(10) : 시장 및 주변 환경에 따른 사업화 여부 기대효과(10) : 경제적, 산업적, 사회적, 기술적 기대효과 > 3세부 : 화재 영상 3D 객체 데이터 (화재 3D 객체 데이터 2,000건, 실내 3D 공간 데이터 8,118평, 150,000건의 화재영상 2D 이미지 데이터) 등으로 만들어진 기획을 발표하게 되었다. 📌 기획 발표 📖 PPT / 대사 ![](https://velog.velcdn.com/images/fag

2023년 1월 29일
·
0개의 댓글
·
post-thumbnail

[kaggle] - 병든 잎사귀 식별

Intro 캐글의 병든 잎사귀 식별 경진대회 'Plant Pathology 2020 - FGVC7' compeition에 참가해 여러 딥러닝 모델 성능 향상 기법을 연습해보았다. 여러 잎사귀 사진을 보고, 딥러닝 모델을 활용해 잎사귀가 어떤 질병에 걸렸는지 식별하는 다중분류 문제이다. 잎사귀가 특정 타깃값일 확률을 예측하면 된다. EDA 데이터 둘러보기 train, test, submission data를 살펴보면, training, test data의 개수가 같은걸 알 수 있고, training data는 원-핫 인코딩 형식으로 되어있음을 알 수 있다. 데이터 시각화 데

2022년 12월 5일
·
0개의 댓글
·
post-thumbnail

[kaggle] - 항공 사진 내 선인장 식별

Intro 캐글의 항공 사진 내 선인장 식별 경진대회 'Aerial Cactus Identification' compeition에 참가해 딥러닝 모델을 다루는 방법을 연습해 보았다. 드론이 보호 구역을 돌아다니며 찍은 항공사진에서 딥러닝 기술로 선인장을 식별하는 작업을 해내야 한다. csv파일 뿐 아니라 이미지 파일 또한 활용해 이미지 데이터에 선인장이 있을 확률을 예측해야 한다. EDA 데이터 둘러보기 데이터를 불러와 살펴본다. ![](https://velog.velcdn.com/images/jailies/post/2ef793df-9d3f-4fdb-bca9-a798bf

2022년 12월 3일
·
0개의 댓글
·
post-thumbnail

[kaggle] - 향후 판매량 예측

Intro 캐글의 안전 운전자 예측 경진대회 'Predict Future Sales' compeition에 참가해 다양한 feature engineering을 시도해보았다. 과거 판매 데이터를 바탕으로 향후 판매량을 예측하는 회귀 문제로, 독특하게 train data외에 3가지 데이터가 더 제공된다. 상점, 상품, 상품분류에 관한 정보를 담은 각각의 파일을 활용하여 데이터를 예측하는 것이다. 또한 타깃값(각 상점의 상품별 월간 판매량)은 반드시 0에서 20개 사이라는 것을 주의해야 한다. EDA 데이터 둘러보기 데이터를

2022년 11월 29일
·
0개의 댓글
·
post-thumbnail

[kaggle] - 안전 운전자 예측

Intro 캐글의 안전 운전자 예측 경진대회 'Porto Seguro's Safe Driver Prediction' compeition에 참가해 다양한 모델링 기법을 연습해보았다. Porto Seguro라는 브라질의 보험사에서 제공한 고객 데이터를 활용해 운전자가 보험을 청구할 확률을 예측하는 대회이다. 데이터에 결측값이 많기에 이를 잘 해결하는 것이 핵심이다. 타깃값은 0과 1로 구분되는데, 0이면 보험금을 청구하지 않는다는 것, 1이면 보험금을 청구한다는 것이다. 타깃값이 2개이므로 이진분류 문제에 속한다. EDA 데이터 둘러보기 데이터를 불러와 training dat

2022년 11월 26일
·
0개의 댓글
·

[kaggle] - 범주형 데이터 이진분류

Intro 캐글의 플레이그라운드 대회 'Categorical Feature Encoding Challenge' compeition에 참가해 이진 분류 문제를 해결해보았다. 이 경진대회는 인위적으로 만든 데이터로 구성되어 있으며 각 feature와 타깃값의 의미를 알 수 없다는 특징을 가지고 있다. 또한 모든 데이터가 범주형이며, bin\으로 시작하면 이진 feature, nom\으로 시작하면 명목형 feature, ord\_로 시작하면 순서형 feature이다. 타깃값도 범주형 데이터이며 0과 1 두개로 구성되어 있기에 이진분류 문제로 볼 수 있다. EDA 데이터 둘러보기 index_col은 불러올 D

2022년 11월 19일
·
0개의 댓글
·
post-thumbnail

[kaggle] - 자전거 대여 수요 예측

Intro 캐글의 플레이그라운드 대회 'Bike Sharing Demand' compeition에 참가해 간단한 회귀 모델을 연습해보았다. 워싱턴 DC의 Capital bikeshare 프로그램에서 과거 사용 기록과 날씨 데이터를 결합해 향후 자전거 대여 수요를 예측하는 대회이다. Capital bikeshare 프로그램은 서울시의 따릉이 시스템과 비슷하다고 생각하면 된다. 자전거 대여 기록과 당시의 날씨 정보로 구성된 2년치의 데이터가 제공된다. Train data는 매달 1~19일의 기록으로, Test data는 매달 20일부터 말일까지의 기록으로 구성된 것이 특징이며, Featur

2022년 11월 18일
·
0개의 댓글
·
post-thumbnail

Book Rating Prediction - RecSys 1차 대회 (2)

팀원들을 통해 여러가지 기술들을 많이 익히고 고려해야될 사항들에 대해 더 공부를 많이 하게 됐다. Data Leakage 고려 train data만 쓴다곤 하지만 그럼에도 Sequential한 부분이 포함돼 있을 수 있다면 test의 특정 상황보다 미래의 정보가 train에 들어있어 test의 특정 시간대 이상의 정보를 활용함으로써 data leakage가 있을 수 있다고한다.. (사실 어떤 말인지는 이해하지만 이렇게 치면 통계적인 방법으로 null값 처리라던지.. 그런 모든 부분은 사용할 수 없는건가 싶은데 팀원의 말이니까 나중에 좀 더 확인해봐야겠다.) WANDB Sweep WANDB에서 sweep이란 기능을 처음 알게됐다. 기본적으로 oputna와 유사한 기능이며 특정 하이퍼파라미터의 범위를 지정해주면 알아서 돌아가며 실행하고 최적의 파라미터를 찾을 수 있게끔 도와준다. (일단 튜토리얼 사이트를 확인해보자) Sweep Tutorial : https://docs.w

2022년 11월 3일
·
0개의 댓글
·
post-thumbnail

[competition] 2022 관광데이터 AI 경진대회 후기

2022 관광데이터 AI 경진대회 22.09.19~22.10.31 진행되었던 '2022 관광데이터 AI 경진대회'가 마무리되었다. 부스트캠프 활동 중 대회나 프로젝트에서 많은 것을 배웠던 기억 때문에 참가를 결정했다. 이번 대회는 A-to-Z를 혼자만의 힘으로 해보고 싶었기에 1인으로 참가했다. 진행 기록과 대회에 대한 소회를 간략히 정리해놓고자 한다. 대회 개요 상기한 링크에서 자세한 정보를 얻을 수 있다. 간략히 설명하자면 이미지와 overview, 카테고리 등을 포함하는 train dataset, 이미지와 overview를 포함하는 test dataset이 주어지고 참가자는 해당 데이터를 이용해 학습을 진행하여 '소'분류 카테고리('cat3')를 예측해야 한다. 아이디어 전형적인 classification 문제라고 생

2022년 11월 2일
·
0개의 댓글
·
post-thumbnail

Book Rating Prediction - RecSys 1차 대회

전체적인 데이터나 code는 공유가 불가능하니 부분적으로만 기록.. Data & BaseLine Data로는 아래가 주어졌고 users, books, ratings baseline code로는 아래와 같이 주어졌다 FM, FFM, WDN, NCF, CNN_FN, DeepCoNN 전처리 위는 users, ratings, books를 모두 합쳤을 때 null시각화이다 Age 우선 users의 age값을 우선 채워줄 필요가 있었다. 여러가지 생각을 했었다. 단순히 유저의 평균으로 fillna drop age가 null인 사람들이 읽은 책을 읽은 사람들의 나이대의 평균 국가별 나이의 평균 1,2 는 가장 기본이 되는 생각이라 일단 제외하고 실제로 책을 읽는

2022년 10월 31일
·
0개의 댓글
·
post-thumbnail

(해커톤) AI 학습용 소방 데이터

📌 대회 📖 대회에 대한 내용 앞서 말한 해커톤 기획서와 서류들이 1차적으로 예선을 통과하여 2차로 발표를 하게 되었다. 📋 심사배점 > 아이디어명(20) : 제안한 아이디어 명칭의 적절성 제안 배경(20) : 경제적, 산업적, 사회적 배경의 적절성 기술성(20) : 제안 배경에 맞는 적절한 기술의 적합성 실현 가능성(20) : 구현 가능 및 타당성 사업성(10) : 시장 및 주변 환경에 따른 사업화 여부 기대효과(10) : 경제적, 산업적, 사회적, 기술적 기대효과 > 3세부 : 화재 영상 3D 객체 데이터 (화재 3D 객체 데이터 2,000건, 실내 3D 공간 데이터 8,118평, 150,000건의 화재영상 2D 이미지 데이터) 등으로 만들어진 기획을 발표하게 되었다. 📌 기획 발표 📖 PPT / 대사 ![](https://velog.velcdn.com/images/fa

2022년 10월 5일
·
0개의 댓글
·
post-thumbnail

(해커톤) AI 학습용 데이터 구축

📌 대회 포스터 📌 대회 개요 📖 대회에 대한 내용 📋 1세부 : 소방관 행동모션 3D 객체 모델링 데이터 > 본 데이터는 통합적 재난관리 체계 구축 및 현장 즉시대응 역량 강화를 위한 소방 분야에 특화된 3D 행동 데이터를 구축하여 다양한 현장에 대응하며 실감훈련이 가능한 AI소방관 개발을 위한 소방관 행동모션 3D 객체 모델링 데이터로, 소방청과 한국전자기술연구원, ㈜블루캡슐, ㈜마로스튜디오, ㈜한컴엔플럭스가 협업하여 중앙소방학교에서 제공하는 ‘화재대응능력 평가[훈련] 교범(2019)’을 기반으로 341종의 행동모션을 선정하여 이를 바탕으로 수집 및 정제, 가공 과정을 거쳐 데이터를 구축하였다, > ![](https://velog.v

2022년 9월 22일
·
0개의 댓글
·
post-thumbnail

[AI] 농산물가격변동률 ( TIL )

시계열 ML(catboost)+DL(lstm) ml (data,feature) - 2차원 (catboost) df=df.astype(np.float32)를 통해 타입 통일 catboost'gridSearchresult 해야할일 grid search parameter 수정하여 rmse값 낮춰보기 catboost 결과 값을 DL 모델에 적용하는 방법 구상 dl (data,time_step,feature) - 3차원 (lstm)

2022년 9월 20일
·
0개의 댓글
·
post-thumbnail

Kaggle의 다양한 기능

Home Tab & Navigator Tab Navigator Tab 좌측에 있는 홈페이지 전환 라우터로 Competition, Datasets, Code, Discussion, Course 등 다양한 탭으로 이동 가능합니다. Your Work Recently Viewed: 최근에 찾아봤던 대회나 데이터 셋에 대해서 보여줍니다. Recently Edited: 본인이 관심있게 본 대회나 데이터 셋에 대한 업데이트 내용을 제공합니다. Home Tab Search (검색창) :검색을 통해 해당 키워드를 가지고 있는 대회나 데이터셋을 검색할 수 있습니다. Explore Code / Dataset : 카테고리 별로 관련된 데이터와 코드를 찾을 수 있도록 도와줍니다. ![](https://velog.velcdn.com/images/uonmf97/post/d765d666-d5e6-428f-b642-a96f5ffa2

2022년 8월 21일
·
0개의 댓글
·