본문 바로가기

검색엔진/Elasticsearch

(3)
Elasticsearch 구성 디렉토리 구조 - elasticsearch 설치 파일의 압축을 풀면 bin, config, lib 디렉토리만 존재하고, 나머지 디렉토리는 실행할 때 생성 됨bin : elasticsearch 실행에 필요한 스크립트와 플러그인 설치 스크립트config : elasticsearch.yml과 logger.yml 파일lib : 검색엔진에서 사용하는 라이브러리data : 별도 path를 지정하지 않으면 기본 index store의 위치logs : 검색엔진에서 기록하는 로그파일plugins : 검색엔진에서 사용하는 모든 플러그인이 설치되는 위치work : 임시 파일 경로 실행 - bin/elasticsearch -f Cluster각 node를 cluster명 기준으로 grouping 하여 서비스 함 - 이름이 다르..
Elasticsearch 주요 용어 1. Index데이터를 저장하기 위한 장소. RDBMS의 데이터베이스와 유사함. 인덱스는 하나 또는 여러개의 document type을 가질 수 있음 2. Shard대량의 데이터를 분산 처리하기 위한 개념으로 큰 크기의 인덱스를 여러개의 작은 인덱스로 나누어 저장하는 것 - Primary Shard : 색인 시 가장 먼저 생성되는 인덱스, 복제의 기본 소스가 됨 - Replica Shard : replica 설정에 따라 primary shard를 복제하여 생성 된 shard 3. Replica서비스 장애 발생 시 서비스의 지속성 보장과 검색 처리량을 높이는 데 유용한 방법. replica는 분산된 다른 노드에 shard와 같은 데이터를 복제하여 서비스의 안정성 및 유연성을 제공 4. Document ty..
Elasticsearch 특징 1. 실시간으로 발생하는 데이터를 기반으로 검색 질의 시 결과에 반영하거나 분석을 통한 결과를 실시간으로 제공2. 데이터의 분산과 병렬 처리가 되므로 실시간 검색 및 분석 가능3. SPOF (single point of failure) 대응을 위한 높은 가용성 제공4. 하나의 클러스터 내에서 indice와 document type을 활용하여 멀티 클라이언트 구성 및 서비스 가능5. 검색엔진을 직접 수정하지 않고 필요한 기능에 대한플러그인을 적용하여 기능을 확장할 수 있음6. NoSQL과 같은 schema free, JSON 기반의 문서구조7. Full text search 지원