엘라스틱(3)
-
Ngram Tokenizer
ngram 토크나이저는 지정된 문자 목록 중 하나를 만날 때마다 먼저 텍스트를 단어로 나눈 다음 지정된 길이의 각 단어에 대해 N-gram을 내보냅니다. N-gram은 지정된 길이의 연속적인 문자 시퀀스입니다. 공백을 사용하지 않거나 독일어와 같이 복합어가 긴 언어를 쿼리하는 데 유용합니다. Example ouput 기본 설정에서 ngram 토크나이저는 초기 텍스트를 단일 토큰으로 처리하고 최소 길이 1과 최대 길이 2를 갖는 N-gram을 생성합니다. POST _analyze { "tokenizer": "ngram", "text": "Quick Fox" } 위 문장은 다음과 같은 terms를 생성합니다. [ Q, Qu, u, ui, i, ic, c, ck, k, "k ", " ", " F", F, Fo..
2022.03.11 -
Match query
입력된 텍스트, 숫자, 날짜 또는 부울 값과 일치하는 document를 반환합니다. 입력된 텍스트는 일치하기 전에 분석됩니다. match쿼리는 fuzzy일치 옵션을 포함하여 full-text 검색을 수행하기 위한 표준 쿼리입니다. Example request GET /_search { "query": { "match": { "message": { "query": "this is a test" } } } } match의 최상위 매개변수 (필수, object) 검색하고자 하는 필드. 의 매개변수 query (필수) 입력된 에서 찾고자 하는 텍스트, 숫자, 부울 값, 날짜 . match쿼리는 검색을 수행하기 전에 입력된 텍스트를 분석 합니다. 이는 match쿼리가 정확한 용어가 아닌 분석된 토큰에 대한 tex..
2022.03.08 -
Query DSL / Term-level queries / Term
설정된 필드에 정확한 용어(term)가 포함된 document를 반환합니다. term쿼리를 사용하여 가격, 제품 ID 또는 사용자 이름과 같은 정확한 값을 기반으로 document를 찾을 수 있습니다. text 필드는 term쿼리 사용을 지양합니다. 기본적으로 Elasticsearch는 text 필드 값을 analysis의 일부로 변경합니다. 이로 인해 text 필드 값과 정확히 일치하는 항목을 찾기가 어려울 수 있습니다. text필드 값을 검색하려면 match쿼리를 사용해야 합니다. Example request GET /_search { "query": { "term": { "user.id": { "value": "kimchy", "boost": 1.0 } } } } term의 최상위 매개변수 (필수,..
2022.03.08