[nlp] 한국어 Word2Vec 사전학습 모델

최승언·2023년 11월 17일
0

nlp

목록 보기
10/11
post-thumbnail

한국어 Word2Vec 모델은 미리 학습된 모델로 공개되어 있습니다. 대표적인 예시는 Facebook에서 제공하는 FastText 라이브러리의 한국어 Word2Vec 모델입니다.

FastText의 한국어 Word2Vec 모델은 다음과 같이 다운로드할 수 있습니다. 아래의 명령을 터미널에서 실행하면 됩니다.

1. bin 파일 다운로드:

wget https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.ko.300.bin.gz
gunzip cc.ko.300.bin.gz

1. text 파일 다운로드:

wget https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.ko.300.vec.gz
gunzip cc.ko.300.vec.gz

위의 명령을 실행하면 FastText의 한국어 Word2Vec 모델을 현재 디렉터리에 다운로드할 수 있습니다. 모델 파일은 압축이 풀린 상태에서 사용 가능합니다.

이외에도 다른 Word2Vec 모델을 사용하고 싶다면, 다양한 리소스에서 학습된 한국어 Word2Vec 모델을 찾을 수 있습니다. 예를 들어, 네이버나 다음과 같은 한국어 웹 코퍼스에서 학습된 모델이 공개되어 있습니다. 학술 논문이나 연구 프로젝트의 웹사이트에서도 다양한 Word2Vec 모델을 찾을 수 있습니다.

profile
작업하다가 막힌부분을 기록하는 곳.

0개의 댓글