티스토리 뷰
ElasticSearch 버젼이 5.x 이상이면 open korean text 를 추천하고 이하이면 은전한닢 또는 arirang 추천.
ElasticSearch 5.x 대의 arirang 은 ElasticSearch 재시작 1회 후 형태소 분석이 1자만 되는 이슈 발생함.
"홍길동" 검색시 "홍"이라는 단어만 분석되어
"홍길동" 검색시 "홍"이 들어간 모든 문서 검색되어버림.
즉, "얏홍"과 같은 구문까지 검색되는 문제 발생함.
Index 설정은:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 | PUT /my_index/_settings { "analysis" : { "filter" : { "my_stop" : { "type" : "stop" , "stopwords" : [ "and" , "is" , "the" ] } }, "analyzer" : { "my_ngram_analyzer" : { "tokenizer" : "my_ngram_tokenizer" }, "openkorean_analyzer" : { "type" : "custom" , "tokenizer" : "openkoreantext-tokenizer" , "filter" : [ "openkoreantext-redundant-filter" , "openkoreantext-phrase-extractor" ] }, "arirang" : { "tokenizer" : "arirang_tokenizer" , "filter" : [ "trim" , "lowercase" , "arirang_filter" , "my_stop" ] } }, "tokenizer" : { "my_ngram_tokenizer" : { "type" : "ngram" , "min_gram" : 2, "max_gram" : 10, "token_chars" : [ "letter" , "digit" ] } } } } |
Type(=RDB Table) 의 mapping (=RDB Schema) 의 analyzer 설정:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 | PUT /my_index { "mappings" : { "info" : { "properties" : { "txt" : { "type" : "text" , "analyzer" : "openkorean_analyzer" }, "date" : { "type" : "date" }, "name" : { "type" : "text" }, "user_id" : { "type" : "long" } } } } } |
'OS-서버-서비스 > Elasticsearch' 카테고리의 다른 글
ElasticSearch Index settings 변경 (0) | 2018.05.21 |
---|---|
Elasticsearch Index 중단 없이 매핑 변경 재인덱싱 (0) | 2018.05.21 |
댓글
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
- Make Use Of
- How to geek
- 인터넷 통계정보 검색시스템
- 트위터 공유 정보모음
- 웹표준KR
- 치우의 컴맹탈출구
- Dev. Cheat Sheets
- w3schools
- Dev. 조각들
- ASP Ajax Library
- CSS Tricks
- WebResourcesDepot
- jQuery Selectors Tester
- DeveloperSnippets
- Smashing Magazine
- Nettuts+
- devListing
- 웹 리소스 사이트(한)
- Mobile tuts+
- Dream In Code
- Developer Tutorials
- CSS3 Previews
- 자북
- 안드로이드 사이드
- Code Visually
- Code School
- SQLer.com
- 무료 파워포인트 템플릿
- iconPot
- Free PowerPoint Templates
- Design Bombs
- Web Designer Wall
- 1st Webdesigner
- Vandelay Design
- 무료 벡터 이미지 사이트들
- Tripwire Magazine
- Web TrendSet
- WebMonkey
- 윤춘근 프리젠테이션 디자이너 블로그
- cz.cc 무료 DNS
- [웹하드] MediaFire
- [웹하드] DivShare
- 한컴 인터넷 오피스
TAG
- nodejs
- 한글
- Wordpress
- 안드로이드
- classic asp
- ASP
- Docker
- IE
- centos
- Prototype
- JSON
- Android
- mssql
- 워드프레스
- JQuery
- CSS
- Debug
- nginx
- IOS
- sencha touch
- Linux
- git
- laravel
- javascript
- iis
- Mac
- PHP
- iphone
- API
- Chrome
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함