FastText

jaeha_lee·2023년 4월 5일
0
  • Word2Vec의 경우 단어 사이의 임베딩 벡터를 이용하여 학습을 진행
    • 학습에 존재하지 않았던 데이터 처리 못함
  • FastText의 경우 각 단어를 문자 단위로 나누어서 학습
    • 학습에 존재하지 않았던 단어의 임베딩 벡터 생성 가능
from gensim.models import FastText
# 모델 설정
model = FastText(min_count=1, window=2,vector_size = 300)
# min_count : n번 이상 등장한 단어만

model.build_vocab(input_data)
model.train(input_data,total_examples=model.corpus_count, epoch=100)
# 사용법은 Word2Vec이랑 비슷

Word2Vec

0개의 댓글