vector를 이용한 검색 최적화

테스트모델 : mxbai-embed-large, nomic-embed-text, bona/bge-m3-korean

위 3개 중에는 bona/bge-m3-korean 가 그나마 가장 내가 원하는 기능을 해주었음. 위 모델들은 ollama에서 찾은 opensource 모델들임.

실습환경

ollama, postgreSql, java

ollama를 로컬에서 올리고 각 모델들을 통해 임베딩하여 postgreSql에 저장.(데이터셋 만듬)

임의의 문장, 단어를 임베딩한 벡터값으로 DB에서 유사한 값을 찾아오도록 함.

고려해야 할 사항.

서버에서 Ollama같은 를 실행시켜야함 → 리소스 들어감. 최적의 모델 찾기 → 또한 각 모델별로 크기도 고려해야함 bona/bge-m3-korean 의 경우 1.2G였음