검색이란?
- 기억 공간 안에 들어 있는 자료 중 어떤 성질을 만족하는 자료를 찾아내는 일(구글 사전)
성능평가 요소
- Recall : 모두 나와야하는 것중 검색 결과에 포함된 것의 비율(재현률)
- Precision : 검색결과에 포함된 것중 제대로 나온 것의 비율(정확률)
▷정확하고 제대로 나오기 위해서는 느릴 수 밖에 없음 > 해결법 : 역색인 구축
색인(Index)란?
- 특정한 데이터가 어느 위치에 있는지 미리 저장해두어 검색 시에 빠른 속도로 찾을 수 있도록 하는 것
- 키워드를 토대로 데이터를 찾을 경우 마지막 데이터까지 확인을 해야할 수 있어 시간이 오래걸릴 수 있다.
역색인(Inverted-Index)란?
- 데이터를 색인하는 과정에서 찾고자 하는 키워드를 기준으로 위치를 저장해두어 속도를 개선한 것.
'Computer > Elastic Search' 카테고리의 다른 글
Index 생성 API (0) | 2019.12.04 |
---|---|
엘라스틱 서치 설치 (0) | 2019.12.03 |