๐ค LangCon 2023 ์๋ฃ
์์ ๋งํฌ : https://www.youtube.com/playlist?list=PLqkITFr6P-oQwn2hcDauXFht48XHfJojQ
๋ฐํ ์๋ฃ : https://songys.github.io/2023Langcon/about/
KoELECTRA๋ก ์ ๋ช ํ์ ๋ฐ์ฅ์๋, EleutherAI์์ ํ๋ํ์๋ฉด์ Polyglot, olso๋ฑ ๊ฐ๋ฐํ์ ํ๋์ ๊ณ ํ์ ๋, ํ ์ค์ ๊ณ ์ํ๋, ์ด๋ฃจ๋ค๋ฅผ ๊ฐ๋ฐ์ค์ด์ ์ค์บํฐ๋ฉ ์ด์ฃผํ๋ ๋ฑ NLP์ ๊ณ์์ ์คํ ์์ค ๋ฐ ์ปค๋ฎค๋ํฐ์ ๋ง์ ๊ธฐ์ฌ๋ฅผ ํด์ฃผ๊ณ ๊ณ์๋ ๋ถ๋ค์ด ์คํผ์ปค๋ก ์ฐธ์ฌํ์ จ๋ค. ๊ทธ์ธ์๋ ๋จธ์ ๋ฌ๋ ๋์คํ์ ์์ฒญ๋ ๊ธฐ์ฌ๋ฅผ ํ์๋ ๋ฐํด์ ์๊ฐ๋ ๋ฟ๋ง ์๋๋ผ ํ์ด์ค๋ถ ๊ทธ๋ฃน์ ์๊ฐ ์์ฐ์ด์ฒ๋ฆฌ๋ก ํ๋ํ์ จ๋ Liner์ ํํ๋๋ ๋ต ์ ์์๋ค.
ChatGPT๊ฐ nlp๋ฟ๋ง ์๋๋ผ ์ ์ธ๊ณ๋ฅผ ๊ฐํํ์๊ธฐ์ ์ ๋ฐ์ ์ผ๋ก ์ธ์ ๋ชจ๋ ChatGPT๊ฐ ์ธ๊ธ๋์๊ณ ๊ทธ์๋ํ ์์ผ๋ก์ ๋ฐฉํฅ์ฑ์ ๋ํ ์ด์ผ๊ธฐ๊ฐ ๋ง์๋ค. ์คํผ์ปค ๋ถ๋ค์ ๊ฒฝํ๊ณผ ํต์ฐฐ๋ ฅ์ ์ป์ ์ ์๋ ๋๋ฌด ์์คํ ์๋ฆฌ์๊ธฐ์ ์๊ฐ์ฃผ์ ๋ด์ฉ์ ๊ฐ๋จํ ์ ๋ฆฌํด๋ณด์๋ค.
1๏ธโฃ "์ฐ๋ฆฌ๋ ๋จธ์ ๊ณผ ์ด๋ป๊ฒ ๋ค๋ฅด๊ฒ ์ด์ผ๊ธฐํ๋?" - ์ด์ข
์๋(์ผ์ฑ์ ์)
GPT3 ๋ฐ ChatGPT์ ๋ํ ์ ๋ฐ์ ์ธ ์๊ฐ๋ฅผ ํด์ฃผ์
จ๋ค. GPT3์์ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ธ Instruct tuning ๋ฐ RLHF๋ฅผ ์์ธํ ๋ค๋ฃจ์๋ค. ์ดํ ChatGPT์ ํ๊ณ ๋ฐ ์ธ๊ฐ์ ๋ํ์์ ์ฐจ์ด์ ์ ๋ํด์ ์ค๋ช
ํ์
จ๊ณ ์ด๋ฅผ ๊ทน๋ณตํ๊ณ ๋ฐํ์๋, semantic, reasonable ์ ๊ฐ์ ํ๊ธฐ ์ํ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์(DialogAct, NL description, Chain of Speech)์ ์ ์ํ์๋ค.
2๏ธโฃ "ํน์ ๋๋ฉ์ธ์ ๋ง๋ ์ธ์ด๋ชจ๋ธ์ ์ด๋ป๊ฒ ๋ง๋ค๊น?" - ๋ฐ์ฅ์๋ (BHSN)
KoELECTRA, KLUE-RoBERTa, KoBigbird๋ฑ ๋ค์ํ ํ๊ตญ์ด ๊ธฐ๋ฐ ์ธ์ด๋ชจ๋ธ์ ๋ง๋ค๊ณ ๊ณต๊ฐํ์
จ๋๋งํผ ๊ทธ ๋
ธํ์ฐ๋ฅผ ์๋์์ด ์ ๋ฌํด์ฃผ์
จ๋ค. ๋ง์ ๊ณณ์์ ๊ฐ ๋๋ฉ์ธ์ ๋ง๋ ์ธ์ด๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ ํ๋๋ฐ, Domain specific ๋ชจ๋ธ ๊ฐ๋ฐ ์ ์ฃผ์ํด์ผํ ์ ์ ๋ํด์ ์๊ฐํด์ฃผ์
จ๋ค.
3๏ธโฃ Shallowํ ์์ฐ์ด ๊ฒ์ ๋ง๋ค๊ธฐ
์์ฑ ์ ๋ต์ ๊ฐ์ง๊ณ ์๋ ํ ์ค ๋ด์๋ ๋ง์ ๊ธฐ๋ฅ๋ค์ด ์กด์ฌํ๋ค.. ๊ทธ๋ฌํ ๊ธฐ๋ฅ๋ค์ ๊ฒ์์ผ๋ก ์์ฝ๊ฒ ์ฐพ๊ธฐ ์ํ ๊ฒ์ ์์คํ
๋์
๊ธฐ์ ๋ํด ์๊ฐํด์ฃผ์
จ๋ค.
4๏ธโฃ "EleutherAI์์์ 1๋
" - ๊ณ ํ์
๋ (ํ๋)
์ด๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ ์ฐ๊ตฌํ๋ ๋น์๋ฆฌ ์ฐ๊ตฌ๋จ์ฒด์ธ ์ผ๋ฃจ๋AI ๋ฐ ๊ทธ๊ณณ์์์ ํ๋์ ๋ํด ์๊ฐํด์ฃผ์
จ๋ค. ์ผ๋ฃจ๋AI์์๋ ์ ๊ธฐํ๊ฒ๋ ๊ณ๊ธ์ฒด๊ณ(5๊ฐ)๊ฐ ์๋ค๊ณ ํฉ๋๋ค. ํ์
๋์ Level2์ ํด๋นํ๋ Regular ๋ญํฌ๋ผ๊ณ ํ๋ค.
ํ์
๋์ ๊ทธ๊ณณ์์ Polyglot, oslo๋ฅผ ๊ฐ๋ฐํ์
จ๋๋ฐ ์๊ฐ๊ด๊ณ์ ployglot์ ๋ํด์๋ง ๋ง์ํด์ฃผ์
จ๋ค. ๊ฐ์ฅ ํ๋ค์๋ ์ ์ ์ธ๋ ฅ๊ด๋ฆฌ์๋๋ฐ, ์๋ฌด๋๋ ์คํ์์ค ํ๋ก์ ํธ์ด๋ค๋ณด๋ ๋๋ถ๋ถ ์ฐธ์ฌ์จ์ด ์ ์กฐํ๋ค๊ณ ํ๋ค.
Ployglot v1์ ์๋ฌด๋๋ ๋น ๋ฅด๊ฒ ๊ฐ๋ฐ๋๋ค๋ณด๋ ์ ์ฒ๋ฆฌ๊ฐ ๋ง์ด ๋ถ์กฑํ์์ผ๋ฉฐ ์ฑ๋ฅ ํ๊ฐ์ ๋ํด์๋ ๋ถ์กฑํ ๋ฉด์ด ์์๊ธฐ์, ployglot v2๋ ์๋์ ๊ฐ์ ์ฌํญ์ด ๊ฐ์ ๋๋ค๊ณ ํ๋ค.
5๏ธโฃ โ์ธ๊ณต์ง๋ฅ๊ณผ ์น๊ตฌ๊ฐ ๋ ์ ์์๊น์?โ - ์ด์ฃผํ (์ค์บํฐ๋ฉ)
๊ด๊ณ ์งํฅํ ์ฑ๋ด
6๏ธโฃ โBuilding large language models at scaleโ - ์ ์ ๊ท (Lablup)
๋ด ์์ค์์๋ ์ดํดํ๊ธฐ ์ฝ์ง ์์์ง๋ง, ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ์ ๋ฐ์น๊ธฐ ์ํ ์ธํ๋ผ์ ๋ํด ์๊ฐํด์ฃผ์
จ๋ค.
๋ช๋
์ ๋งํด๋ BERT(110m)๋ ๊ต์ฅํ ํฐ ๋ชจ๋ธ์ด์์ง๋ง ์ด โํฐ ๋ชจ๋ธโ์ ๋ํ ์ ์๊ฐ ํด๋ง๋ค ๋ฐ๋๊ณ ์๋ค. ํ์ฌ ๊ฐ์ฅ ํฐ ๋ชจ๋ธ์ธ PaLM์ 540B ํฌ๊ธฐ๋ฅผ ๊ฐ์ง๊ณ ์๊ณ . ํ์ต์ ์ํด 6,144๊ฐ์ TPU๊ฐ ์ฌ์ฉ๋์๋ค.
์ธ์ด๋ชจ๋ธ ๊ด๋ จ ํนํ ํ๊ตญ์ด ๊ด๋ จ ์ธ์ด๋ชจ๋ธ์ ๋ํ ์๋ฃ๋ ์์ง ๋ง์ด ๋ถ์กฑํ๋ฐ ์ด๋ ๊ฒ ์ข์ ์ปจํผ๋ฐ์ค๊ฐ ์์ด์ ๋ ๋ฐ์ ํ ์ ์๋ ๊ฒ ๊ฐ๋ค. ๋งคํด ์ฐธ๊ฐํ ์์ .