[부스트캠프 AI Tech 5기] HyperCLOVA

박상우·2023년 4월 28일
0

부스트캠프

목록 보기
49/53
post-thumbnail

네이버의 Large Language Model
네이버의 방대한 데이터를 학습하여 만든 초 거대 AI 언어 모델

HyperCLOVA

LLM

  • LLM은 모델 사이즈를 키우고 대용량의 텍스트 데이터를 학습시켜 성능을 극대화 한 언어 모델
  • 네이버 하이퍼클로바는 세계 3번째 공개되어 생태계를 만들어가는 중
  • 영국, 미국, 중국, 이스라엘, 한국만 자체적으로 언어 모델을 구축 및 운영 중 (이외 나라는 오픈 소스를 사용)

Scaling Laws

  • 파라미터 숫자가 커질수록 성능이 증가한다는 법칙
  • 모델의 크기가 커질수록 더 많은 역량을 가질 수 있음

GPT-3 vs ChatGPT

  • 강화학습으로 사람이 원하는 답변 형식, 인터랙션을 챗봇 형식으로 대화가 가능
  • Hallucination과 같이 문맥, 어법 적으로는 틀리지 않았으나 틀린 답변을 강화 학습을 통해 해결
  • GPT-3에 비해 이용이 편해짐
  • HyperCLOVAX 는 ChatGPT와 같이 소통 가능하게 함
  • Back-bone은 GPT-3.5 수준
  • 글로벌 빅테크 대비 한국어 데이터에서 우수함
    • ChatGPT 대비 3,500 배의 한국어 데이터로 학습
  • 플랫폼 개발/운영 노하우 및 전문가 보유
    • Open AI에 버금가는 AI 인력 보유
  • 글로벌 선도 수준의 인프라

CLOVA Studio

  • 언어모델 기반의 No Code AI 플랫폼
  • 자연어(한국어) 기반으로 모델링하고 해당 모델링을 바탕으로 웹서비스, 앱서비스에 연동할 수 있는 API를 제공
  • B2B 서비스

플레이그라운드


사용자가 직접 텍스트 중심의 AI 모델링을 하기 위한 작업 공간

  • 프롬프트에 자연어로 요구사항을 입력
  • Generation Type은 총 4가지로 각각 다른 특성 (Rolling 위주로 살펴 보는 것을 추천)
  • 프롬프트 엔지니어링이 익숙하지 않아, 원하는 결과물이 잘 안나올 때는 공유하기 기능을 통해 문의하는 것을 추천
  • 테스트 앱은 실제로 API를 발급하는 기능
  • ChatGPT와 같이 zero shot learning, few shot learning 둘 다 가능
  • 웹 소설을 작성해서 몰래 제출했더니, 꽤나 좋은 성과도 얻었음!
profile
세상아 덤벼라

0개의 댓글