# lucene
Elasticsearch Synonym 검색 이슈케이스
검색서비스를 운영 중에, 다음과 같은 시나리오 케이스가 존재 하였고 검색이 이루어지지 않는 이슈가 발생하였다. 그 이슈 시나리오는 다음과 같다. 푸켓의 동의어가 뿌켓으로 운영 중이다푸켓의 동의어로 푸켕을 추가하였다사전 배포와 재색인이 수행되었다푸켓이라는 단어로 검색이
Lucene
자바 기반 IR 라이브러리. 색인과 검색이라는 핵심 기능 지원IR : Information retrieval, 고성능 정보 검색역색인 구조에 맞게 저장하는 행위 또는 결과물을 지칭텍스트에서 Analyzer를 사용하여 유의미한 Term 추출하고 저장역색인 : <Te
검색엔진이란?
관계형 데이터베이스에서의 like 검색은 Full text 탐색을 한다. 1000만건,1억 등 대용량의 테이블에서 "나이키"를 검색한다면 성능에 이슈가 있을것이다."nike,나이키","핸드폰,휴대폰","신발,운동화" 유사한 키워드들은 동일한 검색 결과가 필요하다."맛있

ELASTIC SEARCH는 뭘로 만들어졌을까?
오늘 es 관련 담소를 나누다가, 문득 궁금한 점이 생겼다. es는 뭘로 개발되어있을까..? 궁금해진 사유는 이렇다. 뭐 대충 이런 얘기를 하다가,, 뭐 이렇게...
Lucene PostingsFormat 한눈에 보기
출처 - https://github.com/mocobeta/lucene-postings-format이 페이지는 Apache Lucene 의 기본 PostingsFormat - 역 색인(인덱스)를 저수준 바이너리 형식으로 표현하여 한눈에 볼 수 있도록 고급사용
Lucene 색인 세그먼트
루씬의 대표적인 자료구조 중 하나. 각 세그먼트는 그 자체로 개별적인 색인이며, 전체 색인에 들어있는 문서 중 일정량을 담고 있다. IndexerWriter에서 추가하거나 삭제한 문서를 버퍼에 쌓아 두고 있다가 flush하면 새로운 세그먼트가 생성된다. 그리고 검색할
lucene 검색
lucene에서 검색을 담당하는 클래스이다. 해당 클래스를 이용하여 문서의 색인을 검색한다. 검색이후 검색된 결과를 가지고 있는 객체를통해서 Iterator하여 출력한다.색인된 파일을 읽는 클래스이다. 색인된 파일이 있는 위치를 지정하여 검색대상 위치를 지정할 수 있다
TIL 2021.05.30 [Lucene]
루씬은 어플리케이션이나 웹사이트에 검색기능을 쉽게 만들수잇는 자바로 만들어진 full-text search 라이브러리이다. full-tet index에 content를 추가하는 방식으로 루씬은 작동한다. 그리고 인덱스를 가지고 쿼리를 실행해서 정렬된 결과를 반환한다.
lucene 색인
lucene에서 색인을 담당하는 클래스이다. 해당 클래스를 이용하여 문서의 내용을 색인한다.(해당 클래스에서는 검색된 내용을 확인은 불가능하다고 적혀있다. 나중에 검색을 담당하는 클래스에 의해서 확인이 가능해 보인다.) 파일의 형태로 저장되며 lucene의 검색저장 자
Lucene-in-action
Elasticsearch를 다루면서 실제 index, search를 담당하는 lucene에 대해 궁금해졌다.루씬인액션책을 보며 lucene이 어떤 라이브러리인지 확인해 보고자 한다.단, 해당 책은 2013년 이후로 더이상 최신버전으로 출간하지는 않는것으로 보인다.(최신

Lucene File Format 메모
Lucene index는 여러개의 Segment로 이루어져있다고 하는데 실제로 File을 들여다보면 위와 같이 정리할 수 있음. (\_X.에서 X는 Segment의 이름이다.) 왼쪽부터 시작하면 Lucene index는 실제로 여러 개의 Segment를 가질 수 있음.