시소러스1 통계 기반 언어 모델 특징 및 한계점(feat. 시소러스, WordNet) 통계 기반 언어 모델은 통계적 방법을 사용하여 인간 언어를 분석하고 생성하는 자연어 처리(NLP) 모델 클래스입니다. 시소러스와 같은 유의어 사전과 통계적 언어 모델은 자연어 처리(NLP)에서 보완적인 역할을 하지만 접근 방식과 기능이 근본적으로 다릅니다. 먼저 시소러스에 대해 알아보겠습니다. 시소러스(Thesaurus) 란? 시소러스의 사전적 의미는 단어를 의미에 따라 분류·배열한 일종의 유의어 사전이라고 합니다. 뜻이 비슷한 단어를 그룹으로 분류하고 단어 사이의 상위와 하위 관계를 트리로 체계화하는 방법입니다. NLP에서 가장 유명한 시소러스는 WordNet이 있죠. WordNet 워드넷은 프린스턴 대학에서 1985년부터 구축되었는데요. 우리가 잘 알고 있는 ImageNet이 WordNet의 이름을 .. 2024. 3. 18. 이전 1 다음