FastText

jaeha_lee·2023년 4월 5일

Word2Vec의 경우 단어 사이의 임베딩 벡터를 이용하여 학습을 진행
- 학습에 존재하지 않았던 데이터 처리 못함
FastText의 경우 각 단어를 문자 단위로 나누어서 학습
- 학습에 존재하지 않았던 단어의 임베딩 벡터 생성 가능

from gensim.models import FastText
# 모델 설정
model = FastText(min_count=1, window=2,vector_size = 300)
# min_count : n번 이상 등장한 단어만

model.build_vocab(input_data)
model.train(input_data,total_examples=model.corpus_count, epoch=100)
# 사용법은 Word2Vec이랑 비슷

Word2Vec

jaeha_lee

이전 포스트

Word2Vec

다음 포스트

FastText

Word2Vec

프로세스 kill

0개의 댓글