이 연구의 목적은 한국어 워드넷(KorLex)을 사용하여 그래프 임베딩 벡터를 생성하고 이를 신경망 단어 임베딩 모델에 적용하는 것입니다. 언어의 어휘 의미 지식은 단어 임베딩 벡터나 WordNet과 같은 어휘 데이터베이스의 그래프 구조로 표현될 수 있습니다. 두 표현 방식 모두 공통된 지식을 포착하지만, 일부 의미 지식은 특정 방식에서 주로 포착되기도 합니다.
이전 연구인 Path2vec은 두 단어 간의 유사도 점수를 사용하여 WordNet 그래프를 그래프 임베딩 벡터로 표현했습니다. 본 연구에서는 두 가지 주요 접근 방식을 제안합니다:
1. 한국어 어휘 데이터베이스인 KorLex의 지식을 그래프 임베딩 벡터로의 지식 전이
2. 위 임베딩 벡터를 심층 신경망 단어 임베딩에 적용하여 한국어의 추가적인 의미 지식을 포착
테스트 세트에서 제안된 접근 방식은 유사성 및 유추 분석에서 추가적인 의미 지식을 포착하여 성능을 향상되었습니다. 추후 이 방식의 변형을 다른 심층 신경망 임베딩 모델에 적용할 계획입니다.