[파이썬] Gensim에서의 KeyedVectors

06 Sep 2023

gensim

Gensim의 KeyedVectors를 사용하기 위해서는 gensim 패키지가 설치되어 있어야 합니다. 설치되어 있지 않다면, 다음 명령어를 사용하여 설치할 수 있습니다:

pip install gensim

다음은 Gensim의 KeyedVectors를 사용하여 단어 간 유사도를 계산하는 간단한 예제 코드입니다:

from gensim.models import KeyedVectors

# 사전 트레이닝된 단어 임베딩 모델 로드
model_path = 'path/to/pretrained/model.bin'
word_vectors = KeyedVectors.load_word2vec_format(model_path, binary=True)

# 단어 간 유사도 계산
similarity_score = word_vectors.similarity('apple', 'orange')
print('Similarity between "apple" and "orange":', similarity_score)

# 단어 간 유사한 단어 찾기
similar_words = word_vectors.similar_by_word('car', topn=5)
print('Words similar to "car":', similar_words) 

이 예제에서는 이미 사전 트레이닝된 단어 임베딩 모델을 KeyedVectors.load_word2vec_format() 함수를 사용하여 로드합니다. 모델의 경로와 형식에 따라 이 함수를 조정해야 합니다.

단어 간 유사도를 계산하기 위해 similarity() 함수를 사용하고, 단어 간 유사한 단어를 찾기 위해 similar_by_word() 함수를 사용합니다. 다른 유용한 함수와 기능에 대해서는 Gensim의 공식 문서를 참조하십시오.

Gensim의 KeyedVectors는 다양한 자연어 처리 작업에서 단어 간 유사도 및 관련성을 계산하는 데 도움이 되는 강력한 도구입니다. 이를 통해 뛰어난 텍스트 기반 애플리케이션을 개발할 수 있습니다.