# lucene

17개의 포스트

Elasticsearch Synonym 검색 이슈케이스

검색서비스를 운영 중에, 다음과 같은 시나리오 케이스가 존재 하였고 검색이 이루어지지 않는 이슈가 발생하였다. 그 이슈 시나리오는 다음과 같다. 푸켓의 동의어가 뿌켓으로 운영 중이다푸켓의 동의어로 푸켕을 추가하였다사전 배포와 재색인이 수행되었다푸켓이라는 단어로 검색이

2023년 4월 7일
·
0개의 댓글
·
post-thumbnail

[ES] ElasticSearch, 너 뭐냐?

ElasticSearch 검색엔진에 대해 알아보자

2022년 7월 27일
·
0개의 댓글
·

Lucene

자바 기반 IR 라이브러리. 색인과 검색이라는 핵심 기능 지원IR : Information retrieval, 고성능 정보 검색역색인 구조에 맞게 저장하는 행위 또는 결과물을 지칭텍스트에서 Analyzer를 사용하여 유의미한 Term 추출하고 저장역색인 : <Te

2022년 5월 5일
·
0개의 댓글
·

검색엔진이란?

관계형 데이터베이스에서의 like 검색은 Full text 탐색을 한다. 1000만건,1억 등 대용량의 테이블에서 "나이키"를 검색한다면 성능에 이슈가 있을것이다."nike,나이키","핸드폰,휴대폰","신발,운동화" 유사한 키워드들은 동일한 검색 결과가 필요하다."맛있

2022년 5월 5일
·
0개의 댓글
·
post-thumbnail

포켓몬으로 알아보는 루씬 (4) Sort query

공격력이 가장 큰 불타입 포켓몬 5마리를 조회합니다.

2022년 3월 2일
·
0개의 댓글
·
post-thumbnail

포켓몬으로 알아보는 루씬 (3) Range Query

공격력이 120 이상인 땅타입 포켓몬을 찾아보겠습니다.

2022년 3월 2일
·
0개의 댓글
·
post-thumbnail

포켓몬으로 알아보는 루씬 (2) Boolean query

이번 글에서는 루씬으로 악 타입인 포켓몬을 검색하겠습니다.

2022년 3월 2일
·
0개의 댓글
·
post-thumbnail

포켓몬으로 알아보는 루씬 (1) 인덱싱

이번 글에서는 포켓몬 데이터를 루씬에 저장하겠습니다.

2022년 3월 2일
·
0개의 댓글
·
post-thumbnail

포켓몬으로 알아보는 루씬 (0) 개요

포켓몬 데이터로 루씬을 알아봅시다.

2022년 3월 2일
·
0개의 댓글
·
post-thumbnail

ELASTIC SEARCH는 뭘로 만들어졌을까?

오늘 es 관련 담소를 나누다가, 문득 궁금한 점이 생겼다. es는 뭘로 개발되어있을까..? 궁금해진 사유는 이렇다. 뭐 대충 이런 얘기를 하다가,, 뭐 이렇게...

2022년 2월 18일
·
0개의 댓글
·

Lucene PostingsFormat 한눈에 보기

출처 - https://github.com/mocobeta/lucene-postings-format이 페이지는 Apache Lucene 의 기본 PostingsFormat - 역 색인(인덱스)를 저수준 바이너리 형식으로 표현하여 한눈에 볼 수 있도록 고급사용

2021년 10월 28일
·
0개의 댓글
·

Lucene 색인 세그먼트

루씬의 대표적인 자료구조 중 하나. 각 세그먼트는 그 자체로 개별적인 색인이며, 전체 색인에 들어있는 문서 중 일정량을 담고 있다. IndexerWriter에서 추가하거나 삭제한 문서를 버퍼에 쌓아 두고 있다가 flush하면 새로운 세그먼트가 생성된다. 그리고 검색할

2021년 6월 3일
·
0개의 댓글
·

lucene 검색

lucene에서 검색을 담당하는 클래스이다. 해당 클래스를 이용하여 문서의 색인을 검색한다. 검색이후 검색된 결과를 가지고 있는 객체를통해서 Iterator하여 출력한다.색인된 파일을 읽는 클래스이다. 색인된 파일이 있는 위치를 지정하여 검색대상 위치를 지정할 수 있다

2021년 5월 31일
·
0개의 댓글
·

TIL 2021.05.30 [Lucene]

루씬은 어플리케이션이나 웹사이트에 검색기능을 쉽게 만들수잇는 자바로 만들어진 full-text search 라이브러리이다. full-tet index에 content를 추가하는 방식으로 루씬은 작동한다. 그리고 인덱스를 가지고 쿼리를 실행해서 정렬된 결과를 반환한다.

2021년 5월 30일
·
0개의 댓글
·

lucene 색인

lucene에서 색인을 담당하는 클래스이다. 해당 클래스를 이용하여 문서의 내용을 색인한다.(해당 클래스에서는 검색된 내용을 확인은 불가능하다고 적혀있다. 나중에 검색을 담당하는 클래스에 의해서 확인이 가능해 보인다.) 파일의 형태로 저장되며 lucene의 검색저장 자

2021년 5월 24일
·
0개의 댓글
·

Lucene-in-action

Elasticsearch를 다루면서 실제 index, search를 담당하는 lucene에 대해 궁금해졌다.루씬인액션책을 보며 lucene이 어떤 라이브러리인지 확인해 보고자 한다.단, 해당 책은 2013년 이후로 더이상 최신버전으로 출간하지는 않는것으로 보인다.(최신

2021년 5월 24일
·
0개의 댓글
·
post-thumbnail

Lucene File Format 메모

Lucene index는 여러개의 Segment로 이루어져있다고 하는데 실제로 File을 들여다보면 위와 같이 정리할 수 있음. (\_X.에서 X는 Segment의 이름이다.) 왼쪽부터 시작하면 Lucene index는 실제로 여러 개의 Segment를 가질 수 있음.

2021년 4월 17일
·
3개의 댓글
·