내년 LLM에 넣을 데이터 현저히 작아진다.

hur-kyuh-leez·2023년 12월 23일
0

LLM이 트레이닝 속도 생산성은 높아짐
논문 같은 고급 텍스트 데이터의 생산량은 그대로
OPEN AI가 시장 점유율은 압도적이지만
기술적으로는 거의 모든 테크 기업의 LLM이
내년부터 비슷해 질 것

다른말로는 더이상 LLM 트레이닝을 위한 서버를 증산할 필요가 없다.
반도체 생산이 없을 것 이다.
TSMC
삼성 (KOSPI)
NVIDIA
ARM
Cadence
Autodesk
...
기존에 LLM 수혜주로 뽑혀던 기업들은 공매도 대상

고급 텍스트 데이터가 아닌
일반 텍스트 데이터가 LLM 트레이닝에 쓰여지게 될 것
OPEN AI의 데이터 수집이 점점 적어질 테지만
구글은 아직 건드리지도 않은 데이터가 수북히 쌓여있다
심지어 검색 엔진 최적화를 위해
오래전부터 indexing된 데이터 이다

새로운 알고리즘이 나오지 않는 이상,
구글이 마이크로소프트 보다 우위가 있음.

변동성 기준
현재 마이크로소프트가 구글 보다 10% 프리미엄이 있다.
다른말로는 꽁짜로 최소 10% 벌 기회가 있다는 것 이다.

자체서버, 자체 AI반도체 개발, 자체 데이터 생산 및 피딩이 같지만
보유 데이터와 앞으로 들어올 데이터는 구글이 압도적으로 많음.
OPEN AI는 코딩 데이터 이외는 이제 다 사와야 되는 상황.

결론적으로
무위험 거래는
변동폭에 맞게
구글 롱
마이크로소프트 숏
최소 10%

장기 투자로는
구글, 마이크로소프트 은 롱

TSMC,
삼성 (KOSPI),
NVIDIA,
ARM,
Cadence,
Autodesk 은 숏을 하거나 안건드려야

profile
벨로그에 생각을 임시로 저장합니다. 틀린건 틀렸다고 해주세요 :) 그래야 논리 학습이 강화됩니다.

0개의 댓글