부캠 최종 프로젝트로 만든 대화형 챗봇, 내마리의 간단한 시연영상이다!! 이번 포스트에선 어떤 과정을 통해 마리가 탄생했는지를 알아보자. 마리와 대화하기 (23.08.18 까지 접속 가능)가장 마지막 대화가 무엇이였는지 생각해보자. 그건 팀원들과의 회의가 될수도 있고
GPT-4, BingAI, Bard와 같은 거대 언어모델부터 웹사이트에 있는 간단한 QA챗봇까지 기존의 챗봇들은 보통 정보성 챗봇들이 많다. 질문에 적절한 정보를 내주는 챗봇들은 사용자와의 대화에 초점이 맞춰져있기 보단 정확한 정보를 주거나 질의를 정확히 이해해서 원하
05.03.(월) 10:00 ~ 2023. 05. 18. (목) 19:00문장 내 개체 간 관계 추출 — 문장의 단어(Entity)에 대한 속성과 관계를 예측하는 모델 만들기KLUE(Korean NLU Benchmark) RE(Relation Extraction) da
거대 생성모델의 시초가 되는 GPT의 변천 과정을 살펴보기 위해 선택했다.언어 모델이 다운스트림 태스크에서 zero-shot setting 만으로 다양한 분야에서 좋은 성능을 보일 수 있음을 증명하였다.지금까지의 연구는 단일 과제에 특화된 단일 모델을 개발하는데 치중되
Sentence-level relation extraction (RE) aims at identifying the relationship between two entities in a sentence. Many efforts have been devoted to thi
Natural language understanding comprises a wide range of diverse tasks suchas textual entailment, question answering, semantic similarity assessment,
The dominant sequence transduction models are based on complex recurrent orconvolutional neural networks that include an encoder and a decoder. The be
As language models become more powerful, training and evaluation are increasinglybottlenecked by the data and metrics used for a particular task. For
We introduce a new language representation model called BERT, which stands for Bidirectional Encoder Representations from Transformers. Unlike recent
We explore how generating a chain of thought—a series of intermediate reasoningsteps—significantly improves the ability of large language models to pe
부캠 첫 대회인 STS 대회가 끝나고 1주일 정도 product serving 강의를 들었다. 변성윤(통칭 카일) 마스터님의 강의는 항상 느끼는데 정말 알차고 좋은 것 같다. 사실 부캠에 참여하게된 주된 이유가 내가 만든 모델을 배포하고 관리하는 ML engineeri
평화롭던 강의 기간은 끝나고 첫 level1 기초 대회(STS)가 마무리 되었다. 2주 간의 짧은 기간동안 진행된 리더보드 형 대회로 많은 걸들을 배운 기간이였다. 배운 것들을 문서화해서 정리하는 것이 무엇보다 중요하단 말을 듣고 빠르게 달려왔다. Alt Text남는게
길다면 긴 여정이 끝났다.(사실 이제 시작이다😥)자소서를 쓸때나 코테 준비 할때 이전 기수 분들의 후기가 많은 도움과 위로가 되었으므로 나 역시 기록을 남기고자 한다. 서류는 크게 특이한 점은 없었다. 기본적인 인적사항과 자기소개 문항 4개를 쓰면 됐다. 왜 지원했는
코멘토의 빅데이터 분석 자율과정에서 진행한 조그마한 프로젝트이다. 완전 초창기라 데이터셋 찾는 것도 빡쎘던 기억이 있으나 좋아하던 게임, 배틀그라운드 데이터가 Kaggle에 있기에 신나게 다운받아 주제로 선정하였다. 주제는 '배틀그라운드 게임 데이터를 이용한
image전남대학교 인공감정지능 기초연구실 주최의 제 4회 한국인 감정인식 국제경진대회에 참여한 결과물이다.데이터셋은 드라마 '수상한 삼형제'의 1,513개 씬에서 12,289개 문장을 각각 dysphoria, euphoria, neutral 3 가지 감정 중 하나로
시설물의 개수 혹은 예산 비용이 제한되었을 때, 시설물의 서비스 수준을 높이기 위하여 주어진 제약조건 하에서 시설물이 커버하는 수요량을 최대화하는 위치를 선정하는 방법 기존 AED는 대부분 아파트, 공공기관, 관리사무소와 같은 건물 내부에 위치한다.24시간 커버되지
2022 DSF 데이터 사이언스 페스티벌 경진대회에 참여한 결과물이다.
전체 final 데이터를 8:2비율로 train과 valid셋으로 분리한다. 총 3개의 모델(CatBoostRegressor, XGBRegressor, LGBMRegressor)을 사용하여 각각 하이퍼파라미터 튜닝을 진행하고 가장 좋은 점수를 보인 LGBM 모델을
전체 데이터 전처리 과정 요약전처리 코드가 너무 긴 경우 첨부하지 않았음.기간: 2012 ~ 2015 + 2016(검증용)제공처: 백병원&(주)렉스소프트대회 측에서 제공하는 데이터는 학습을 위한 primary key(날짜, 지역, 성별)와 예측 대상인 심뇌혈관질환 발생
본격적인 대회 시작에 앞서 가벼운 사전조사를 진행하였다. 심근경색증의 발생과 기온은 관계가 깊다. 극도로 추운 날씨와 더운 날씨 또는 급격한 온도변화가 심근경색을 유발할 수 있다. 실제로 여러 연구에서 이런 내용이 보고되었는데, 1985~2012년 세계 약 7000만