테스트모델 :
mxbai-embed-large
,
nomic-embed-text
,
bona/bge-m3-korean
위 3개 중에는 bona/bge-m3-korean
가 그나마 가장 내가 원하는 기능을 해주었음.
위 모델들은 ollama에서 찾은 opensource 모델들임.
실습환경
ollama, postgreSql, java
ollama를 로컬에서 올리고 각 모델들을 통해 임베딩하여 postgreSql에 저장.(데이터셋 만듬)
임의의 문장, 단어를 임베딩한 벡터값으로 DB에서 유사한 값을 찾아오도록 함.
고려해야 할 사항.
서버에서 Ollama같은 를 실행시켜야함 → 리소스 들어감.
최적의 모델 찾기 → 또한 각 모델별로 크기도 고려해야함 bona/bge-m3-korean
의 경우 1.2G였음