티스토리 뷰
ElasticSearch 버젼이 5.x 이상이면 open korean text 를 추천하고 이하이면 은전한닢 또는 arirang 추천.
ElasticSearch 5.x 대의 arirang 은 ElasticSearch 재시작 1회 후 형태소 분석이 1자만 되는 이슈 발생함.
"홍길동" 검색시 "홍"이라는 단어만 분석되어
"홍길동" 검색시 "홍"이 들어간 모든 문서 검색되어버림.
즉, "얏홍"과 같은 구문까지 검색되는 문제 발생함.
Index 설정은:
PUT /my_index/_settings { "analysis": { "filter": { "my_stop": { "type": "stop", "stopwords": [ "and", "is", "the" ] } }, "analyzer": { "my_ngram_analyzer": { "tokenizer": "my_ngram_tokenizer" }, "openkorean_analyzer": { "type": "custom", "tokenizer": "openkoreantext-tokenizer", "filter": [ "openkoreantext-redundant-filter", "openkoreantext-phrase-extractor" ] }, "arirang": { "tokenizer": "arirang_tokenizer", "filter": [ "trim", "lowercase", "arirang_filter", "my_stop" ] } }, "tokenizer": { "my_ngram_tokenizer": { "type": "ngram", "min_gram": 2, "max_gram": 10, "token_chars": [ "letter", "digit" ] } } } }
Type(=RDB Table) 의 mapping (=RDB Schema) 의 analyzer 설정:
PUT /my_index { "mappings": { "info": { "properties": { "txt": { "type": "text", "analyzer": "openkorean_analyzer" }, "date": { "type": "date" }, "name": { "type": "text" }, "user_id": { "type": "long" } } } } }
'OS-서버-서비스 > Elasticsearch' 카테고리의 다른 글
ElasticSearch Index settings 변경 (0) | 2018.05.21 |
---|---|
Elasticsearch Index 중단 없이 매핑 변경 재인덱싱 (0) | 2018.05.21 |
댓글
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
- Make Use Of
- How to geek
- 인터넷 통계정보 검색시스템
- 트위터 공유 정보모음
- 웹표준KR
- 치우의 컴맹탈출구
- Dev. Cheat Sheets
- w3schools
- Dev. 조각들
- ASP Ajax Library
- CSS Tricks
- WebResourcesDepot
- jQuery Selectors Tester
- DeveloperSnippets
- Smashing Magazine
- Nettuts+
- devListing
- 웹 리소스 사이트(한)
- Mobile tuts+
- Dream In Code
- Developer Tutorials
- CSS3 Previews
- 자북
- 안드로이드 사이드
- Code Visually
- Code School
- SQLer.com
- 무료 파워포인트 템플릿
- iconPot
- Free PowerPoint Templates
- Design Bombs
- Web Designer Wall
- 1st Webdesigner
- Vandelay Design
- 무료 벡터 이미지 사이트들
- Tripwire Magazine
- Web TrendSet
- WebMonkey
- 윤춘근 프리젠테이션 디자이너 블로그
- cz.cc 무료 DNS
- [웹하드] MediaFire
- [웹하드] DivShare
- 한컴 인터넷 오피스
TAG
- JSON
- javascript
- Android
- iphone
- git
- IOS
- Debug
- classic asp
- Docker
- Chrome
- API
- CSS
- laravel
- ASP
- 워드프레스
- 안드로이드
- nginx
- IE
- centos
- JQuery
- Prototype
- 한글
- iis
- sencha touch
- Wordpress
- mssql
- Mac
- nodejs
- PHP
- Linux
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함