[AI] 거대언어 모델(LLM, Large Language Model)

김은서·2023년 9월 23일
0
post-thumbnail

배경

목요일 오후에 학교에서 진행하는 'IT 직무특강'을 들었다. 강사님께서는 내가 가고 싶은 또는 관심있는 기업의 보도자료나 IT 관련 기사를 스크랩하는 습관을 들이라고 말씀하셨다. 이 조언은 이 특강뿐만 아니라 다른 데에서도 많이 들었던 내용이었다. 항상 "해야지. 시간 나면 언젠가 시작해보자"라고만 생각하고 정작 실천은 하지 않았는데 이젠 정말 해야 할 때가 온 것 같아 이렇게 시작을 해 본다. 이렇게 하다 보면 내가 가고 싶어하는 기업은 어디이며 내가 원하는 직무가 무엇인지 뚜렷하게 나오지 않을까싶다.

절차

  1. 기사 최소 2개 이상 읽고 스크랩한 후 최대 3줄 요약 정리
  2. 처음 들어보는 단어가 있거나 중요한 단어(용어)라고 생각이 들면 따로 정리하기

잘 나가던 중국 IT 기업에 무슨 일?... "전쟁 시작됐다"는데

요약

중국은 세계에서 두 번째로 LLM을 많이 보유한 국가지만 대다수의 중국 IT 기업들이 생성AI를 활용한 BM(Business Model)을 마련하지 못했고 AI모델들이 서로 지나치게 유사하여 중국 기업들은 최근 경제적으로 어려움을 겪고 있다. 심지어 중국 기업들은 AI 개발에 필수적이라는 평가를 받는 엔비디아의 칩을 제한적으로만 사용하고 있다. 시장은 중국의 AI 모델 가운데 소수만 살아남게 될 것이라고 보고 있다.

LLM이 적힌 문장

  • 실제 중국은 세계에서 두 번째로 거대언어모델(LLM)을 많이 보유한 국가다. 크레디리요네증권(CLSA)에 따르면 중국은 현재 최소 130개의 LLM을 보유하고 있다. 1위는 미국(50%)이다. LLM은 챗GPT 등 생성AI의 ‘바탕’으로, 인간 뇌의 언어 처리 방식인 자연어처리(NLP)에 특화한 모델이라는 평가를 받는다.
  • 글로벌 금융그룹 맥쿼리에서 중국 인터넷·디지털 자산 리서치 부문 책임을 맡고 있는 에스메 포는 “앞으로 6개월에서 1년 사이에 상대적으로 성능이 떨어지는 LLM이 점차 사라지게 될 것”이라고 로이터에 말했다. 중국 벤처캐피탈 Z&Y의 위안 홍웨이 회장은 “2~3개의 LLM이 남아 시장을 장악할 것으로 본다”고 말했다.

공격 많고 해결사 부족한 사이버 보안, "생성 AI가 해결"

요약

사이버 보안 위협 대응 인력이 부족한 상황에서 생성 AI가 구원투수로 나서고 있다. 생성 AI는 보안 강화나 스펨 메일을 거르는 데 등 다양한 분야에서 사용되고 있다.

LLM이 적힌 문장

  • 구글은 지난 5월 거대언어모델(LLM) 팜2를 사이버 보안에 특화해 훈련한 LLM ‘세크-팜(sec-PaLM)’과 세크-팜을 탑재한 보안 플랫폼 ‘구글 클라우드 시큐리티 AI 워크벤치’를 출시했다.

정말 우연하게도 제목만 보고 끌리는 기사를 읽었는데 두 기사에 공통적으로 'LLM'이라는 용어가 등장했다. 'LLM'은 'Lare Language Model'의 약어로 '거대 언어 모델'이라는 뜻이다. 단순 한글 풀이로는 도저히 무슨 뜻인지 이해가 되지 않아 따로 정리해보았다.

LLM(Larege Language Model)

1. 정의

  • 언어모델(LM)을 더욱 확장한 개념으로 인간의 언어를 이해하고 생성하도록 훈련된 인공지능

2. 특징

  • LLM을 활용해 완성된 챗GPT가 출현한 이후 LLM은 딥러닝 알고리즘과 통계 모델을 통한 자연어 처리를 능숙하게 하는데 광범위하게 사용됨
  • 딥 러닝 알고리즘과 통계 모델링을 통해 자연어 처리(Natural Language Processing, NLP) 작업을 수행하는 데에 사용됨
  • 사전에 대규모의 언어 데이터를 학습하여 문장 구조나 문법, 의미 등을 이해하고 생성
  • 주어진 문맥에서 다음 단어를 예측하는 문제에서 LLM은 문장 내의 단어들 사이의 유사성과 문맥을 파악하여 다음 단어를 생성 가능
  • 기계 번역, 텍스트 요약, 자동 작문, 질문 응답 등 다양한 NLP 과제에 활용됨

3. 중요성

  • 최근 네이버 등 국내 주요 플랫폼 기업들이 인공지능을 개발하고 서비스를 확장할 때보다 정확한 한국어를 구사하기 위해서는 방대한 데이터를 통한 언어모델 구축이 필수적
  • 대규모 언어 모델은 다양한 유형의 소통이 필요한 언어나 시나리오에 적합
  • 이를 기반으로 산업과 전반에 AI가 활용되는 범위가 넓어졌고, 연구와 창의성과 생산성 분야에 새로운 지평을 가져다줄 것

4. NPL(자연어 처리, Natural Language Processing)과 차이점

  • NPL ⊃ LLM
  • NPL → 자연어 처리 분야 전반을 아우르는 개념, 텍스트를 이해하고 처리하는 기술에 초점
  • LLM → NLP의 한 부분, 대량의 언어 데이터를 바탕으로 학습된 언어 모델을 사용하여 특정 NLP 작업을 수행하는 데 초점








출처
[시사금융용어] 거대언어모델(LLM) | LLM이란 무엇인가? - 정의, 원리, 주요 모델, 적용 사례

profile
은서는 오늘도 개발 중💻

0개의 댓글