Apache Solr은 XML / HTTP 및 JSON API를 사용하여 Apache Lucene 프로젝트를 기반으로하는 무료 오픈 소스, 플랫폼 독립적이며 고성능 검색 서버입니다. 이 프로젝트는 현재 Apache Software Foundation에서 보급 중입니다.
기능 요약
주요 기능으로는 히트 하이라이트, 패싯 검색, 캐싱, 복제, 웹 기반 관리 인터페이스, 고급 전체 텍스트 검색 기능, HTTP와 같은 표준 기반 공개 인터페이스는 물론 대용량 웹 트래픽에 최적화되어 있습니다. , XML 및 JSON.
또한 포괄적 인 HTML 관리 인터페이스, 서버 통계, 자동 인덱스 복제, 자동 복구 및 장애 조치, 거의 실시간 인덱싱, 유연한 XML 구성 및 확장 가능한 플러그인 아키텍처를 제공합니다.
프로젝트는 스키마가 없으므로 사용자는 Apache Solr을 빠르게 시작할 수 있습니다. 현재 스키마 및 스키마없는 모드가 모두 지원되지만 후자는 강력한 프로덕션 환경으로 이어질 것입니다.
Solr은 필드 유형을 포함하여 다양한 유형을 지원하며, 코드를 작성하지 않고도 Lucene 분석기를 혼합하고 일치시킬 수 있습니다. 또한이 프로젝트는 동적으로 활성화 할 수있는 필드를 지원합니다.
다른 흥미로운 기능 중에는 사용자가 다른 방법을 사용하여 동일한 콘텐츠를 쉽게 분석 할 수있는 복사 필드 기능, 필드 유형을 추측 할 필요가없는 명시 적 유형 지원, 외부 파일을 기반으로 한 맞춤 구성 등이 있습니다. 수많은 추가 텍스트 분석 구성 요소가 포함됩니다.
후드 및 가용성
아파치 솔라 (Apache Solr)의 모습을 살펴보면, 애플리케이션이 자바 프로그래밍 언어로 작성되었으며, 32 비트 및 64 비트 Linux 배포판과 Microsoft Windows 및 Mac OS를 지원한다는 것을 알 수 있습니다 X 운영 체제입니다.
편의를 위해이 파일은 바이너리 및 소스 아카이브로 배포되므로 가능한 한 최소한의 시간과 많은 번거 로움없이 Apache Solr을 쉽게 시작할 수 있습니다.
release :
감독관은 마지막 메시지를 처리 할 수 없습니다.
solr standalone 모드에서 core 이름 바꾸기가 유지되지 않습니다.
QueryComponent의 rq 매개 변수 구문 분석은 더 이상 defType 매개 변수를 고려하지 않습니다.
필터 절의 쿼리 용어가 아무 것도 아닌 경우 SolrQueryParser에서 NPE를 수정합니다.
버전의 새로운 기능 :
보안 프레임 워크의 다른 많은 개선 외에도 Solr에는 이제 ZooKeeper에 자격 증명을 안전하게 저장하는 HTTP Basic Auth를 구현하는 AuthenticationPlugin이 포함되어 있습니다. 이것은 Solr의 관리 화면이나 API에 액세스하는 모든 사용자에게 사용자 이름과 암호를 요구하는 간단한 방법입니다.
ZooKeeper에 저장된 허용 규칙을 사용하여 다양한 리소스에 대한 ACL을 구현하는 세분화 된 제어 기능을 제공하는 빌드 된 AuthorizationPlugin에 있습니다.
JSON Facet API는 패싯 데이터를 계산하기 전에 본질적으로 블록 결합을 수행하고 부모에서 자식, 또는 자식에서 부모로 이동하는 패싯 명령의 도메인을 변경할 수 있습니다.
새로운 Facet Module / JSON Facet API의 성능이 크게 향상되었습니다.
피벗 패싯의 쿼리 및 범위 패싯 피봇 패싯은 JSON Facet API와 마찬가지로 범위 및 쿼리 패싯과 같은 다른 패싯 유형을 중첩 할 수 있습니다.
이 쿼리 파서 옵션과 비슷합니다. MoreLikeThis QParser는 이제 MLT Handler에서 제공하는 모든 옵션을 지원합니다. 쿼리 파서는 일반적인 쿼리를 지정할 수있는 곳뿐만 아니라 클라우드 모드에서도 작동하므로 처리기보다 훨씬 다양합니다.
SolrJ에 추가 된 스키마 API 지원
쿼리 타임 조인 및 블록 조인에 점수 모드 추가.
Smile 응답 형식 추가
버전 4.10.3의 새로운 기능 :
Solr 4.10.2에는 Lucene 4.10.2 및 버그 수정 2 개가 포함 된 10 개의 버그 수정이 포함되어 있습니다.
4.6.1 버전의 새로운 기능 :
Apache Tika 1.4당근 2 3.8.0
Velocity 1.7 및 Velocity Tools 2.0
Apache UIMA 2.3.1
Apache ZooKeeper 3.4.5
버그 수정:
SOLR-5408 : 여러 정렬 기준을 사용하면 CollapsingQParserPlugin 점수가 잘못 계산됩니다.
(Brandon Chapman, Joel Bernstein)
SOLR-5416 : CollapsingQParserPlugin이 태그 / 제외면 처리를 중단합니다.
(David Boychuck, Joel Bernstein)
SOLR-5442 : Tomcat이 Python 클라이언트에서 프록시 응답을 구문 분석 할 수 없습니다.
(Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, 마크 밀러)
SOLR-5445 : 프록시 응답은 각 키의 첫 번째 헤더가 아닌 모든 헤더를 전파해야합니다.
(패트릭 헌트, 마크 밀러)
SOLR-5479 : SolrCmdDistributor 재 시도 로직은 요청의 리더가 1 초 내에 발견되지 않으면 중지됩니다.
(마크 밀러)
SOLR-5532 : SolrJ Content-Type 유효성 검사가 일부 웹 컨테이너 / 프록시에 대해 너무 엄격합니다.
(Jakob Furrer, hossman, Shawn Heisey, Uwe Schindler, Mark Miller)
SOLR-5547 : SolrJ의 CollectionAdminRequest를 사용하여 콜렉션 별명을 작성하면 별명 이름과 콜렉션이 같은 값으로 별명 지정됩니다.
(Aaron Schram, 마크 밀러)SOLR-5577 : 가능성이있는 ZooKeeper 만료로 인해 일정량의 업데이트가 느려지 지 않아서 일정 시간이 지나면 업데이트가 중단됩니다.
(마크 밀러, 크리스틴 Poerschke, Ramkumar Aiyengar)
SOLR-5580 : 명시 적 샤드 및 coreNodeName을 사용하여 코어를 만들 때의 NPE
(양 유양, 마크 밀러)
SOLR-5552 : 리더 복구 프로세스는 샤드의 모든 복제본이 다운되고 복구하려고 할 때뿐만 아니라 복구되어야하는 업데이트를 잃어 버리면 잘못된 리더를 선택할 수 있습니다.
(Timothy Potter, 마크 밀러)
SOLR-5569 복제본은 ACTIVE 상태가 될 때까지 리더에서 시도 및 복구하지 말아야합니다.
(마크 밀러)
SOLR-5568 SolrCore는 다른 SolrCore가 활성 상태가 아니라고 클러스터 상태가 나타 내기 때문에 리더로 결정할 수 없습니다.
(마크 밀러)
SOLR-5496 : 비 검색 HttpClients에서 http 연결 관리자를 공유하고 모든 http 연결 관리자가 종료되도록해야합니다.
(마크 밀러)
SOLR-5583 : ConcurrentUpdateSolrServer # blockUntilFinished는 실행 프로그램 서비스가 종료 된 경우 영원히 기다릴 수 있습니다.
(마크 밀러)
SOLR-5586 : 모든 ZkCmdExecutor가 zk 클라이언트 시간 초과로 초기화되어야합니다.(마크 밀러)
SOLR-5587 : ElectionContext 구현은 ZkCmdExecutor # ensureExists를 사용하여 선거 경로가 올바르게 만들어 졌는지 확인해야합니다.
(마크 밀러)
SOLR-5540 : HdfsLockFactory는 필요할 경우 명시 적으로 잠금 상위 디렉토리를 생성해야합니다.
(마크 밀러)
SOLR-4709 : 구성 파일이 변경된 경우 복제 후 코어 재로드가 경쟁 조건으로 인해 실패 할 수 있습니다. (Mark Miller, Hossman))
SOLR-5503 : IOException 및 상태 500, ConnectException보다는 "리더에게 전달"요청을 덜 적극적으로 다시 시도하십시오.
(마크 밀러)
SOLR-5588 : PeerSync는 모든 연결 실패를 성공으로 간주하지 않습니다.
(마크 밀러)
SOLR-5564 : 폴백 시도시 원래 필드에 hl.maxAlternateFieldLength를 적용해야합니다.
(janhoy)
SOLR-5608 : 닫힌 SolrCore가 ZooKeeper에 상태를 게시하는 것을 허용하지 마십시오.
(마크 밀러, 숀 헤이 세이)
SOLR-5615 : ZK 세션 만료 후 복구를 시도하는 중 교착 상태가 발생했습니다.
(Ramkumar Aiyengar, 마크 밀러)
SOLR-5543 : solr.xml 지속성을 사용할 때 코어 스왑으로 인해 solr.xml에 핵심 항목이 중복되었습니다.
(빌 벨, 앨런 우드워드)
SOLR-5618 : hashCodes가 같고 요청 중 하나에 중복 필터 쿼리가있는 경우 queryResultCache에서 잘못된 캐시 적중 횟수를 수정합니다.
(hossman)
SOLR-4260 : 이전에 추가 된 모든 갱신이 완료되기 전에 ConcurrentUpdateSolrServer # blockUntilFinished가 리턴 할 수 있습니다. 이로 인해 복제본을위한 분산 업데이트가 손실 될 수 있습니다.
(마르쿠스 젤 마마, 티모시 포터, 조엘 번스타인, 마크 밀러)
SOLR-5645 : CoreContainer를 통한 SolrCore 재로드는 새로운 SolrCore로 zk에서 다시 시도하고 등록합니다.
(마크 밀러)
SOLR-5636 : SolrRequestParsers는 모든 요청에 대해 xpath 조회를 수행하므로 동시성 문제가 발생할 수 있습니다.
(마크 밀러)
SOLR-5658 : SolrCloud가 javabin을 사용하여 업데이트를 배포하기 때문에 commitWithin 및 덮어 쓰기가 복제본에 배포되지 않습니다.
(마크 밀러 (Mark Miller), 바룬 고커 (Varun Thacker), 엘로디 산 니어 (Elodie Sannier), 샤린 (Shalin)
최적화 :
SOLR-5576 : 등록하고 모든 SolrCore가 DOWN 상태를 등록 할 때까지 동시성을 향상시킵니다.
(Christine Poerschke via Mark Miller)
버전 4.6.0의 새로운 기능 :
샤드 분할 옵션을위한 많은 개선 및 향상
AnalyzingInfixSuggester를 활용하는 새로운 AnalyzingInfixLookupFactory
상위 카디널리티 필드에서 고성능 필드 축소를위한 새로운 CollapsingQParserPlugin
컬렉션 관리를위한 새로운 SolrJ API
새로운 DocBasedVersionConstraintsProcessor 사용자가 구성한 문서 중심의 버전 관리 규칙을 지원하는 팩토리
새 기본 색인 형식 : Lucene46Codec
새 EnumField 유형
버전 4.5.1의 새로운 기능 :
Solr 4.5.1은 매우 심각한 것으로 간주되는 2 개를 포함한 몇 가지 버그 수정을 포함합니다.
버전 4.5.0의 새로운 기능 :
사용자 지정 샤딩 지원, 향상된 라우팅 및 멀티 스레드 패싯.
버전 4.2.0의 새로운 기능 :
스키마에 대한 읽기 측 REST API. 항상 http를 통해 스키마를 인트로 스코프하고 싶습니까? 이제 할 수 있습니다. 쓰기 편이 다음에 올 것 같네요.DocValues는 Solr에 통합되었습니다. DocValues는 필드 캐시보다 훨씬 빠르게로드 할 수 있으며 RAM이나 디스크 표현과 다른 압축 알고리즘을 사용할 수도 있습니다. 패싱 (faceting), 정렬 및 기능 쿼리 모두 이점을 얻습니다. OS가 faceting을 처리하고 힙에서 캐시를 정렬하는 것은 어떻습니까? 더 이상 60 기가 바이트의 힙을 튜닝하지 않습니까? 새로운 DocValues faceting 메서드를 사용하면 어떻습니까? 개선 된 숫자면 처리? 단.
컬렉션 앨리어싱. 시간 기반 데이터가 있습니까? 임시 컬렉션에서 색인을 다시 생성 한 다음 프로덕션으로 전환하고 싶습니까? 끝난. 샤드 에일리어싱을 계속 지켜봐주십시오.
콜렉션 API 응답. 컬렉션 API는 4.0에서 여전히 매우 새롭고 4.1에서 공정한 비트를 개선했지만 확실하게 응답이 필요했지만 중단되지 않았습니다. 처음에 우리는 Collection API를 슈퍼 폴트 내결함성으로 만드는 결정을 내 렸습니다. 아무도 로그 파일을 조사하여 상황이 어떻게 바뀌 었는지 확인하려고하지 않습니다. 4.2에서 완료되었습니다.
모든 노드의 컬렉션과 상호 작용합니다. 4.2까지는 쿼리 / 업데이트하려는 컬렉션의 복제본이 하나 이상 호스트 된 경우에만 클러스터의 노드와 상호 작용할 수 있습니다. 더 이상 - 의도 한 컬렉션을 가지고 있는지 여부를 묻지 않고 프록시 응답을 받으면 모든 노드를 쿼리하지 않습니다.
새 호스트 주소가 폐기 된 샤드를 대신 할 수 있도록 사용자 정의 샤드 이름을 허용합니다. 탄력있는 ips없이 Amazon에서 작업하고 있습니까? 이건 널위한거야.
Lucene 4.2 압축 된 용어 벡터와 같은 최적화.
버전 3.3.0의 새로운 기능 :
그룹화 / 필드 축소
크기가 더 작은 RAM 소비를 제공하는 새로운 자동 기반의 제안 / 자동 완성 구현입니다.
KStemFilterFactory는 영어에 대한 덜 공격적인 형태소 분석기의 최적화 된 구현입니다.
Solr은 새롭고보다 효율적인 병합 정책 (TieredMergePolicy)을 기본값으로 사용합니다. 자세한 내용은 http://s.apache.org/merging을 참조하십시오.
맞춤법 검사에서 매우 높은 RAM 사용량을 포함하여 중요한 버그 수정.
Apache Lucene 3.3의 버그 수정 및 개선 사항
버전 3.2.0의 새로운 기능 :
JSON 업데이트 형식을 사용할 때 요청 매개 변수로 덮어 쓰기 및 commitWithin을 지정할 수있는 기능
TermQParserPlugin은 필드 패싯 또는 용어 구성 요소에서 반환 된 용어로 필터 쿼리를 생성 할 때 유용합니다.
이제 DebugComponent는 NamedList를 사용하여 설명 객체를 설명의 모델링에 사용하는 것을 지원합니다.
UIMA와 Carrot2 통합 개선
Apache Lucene 3.2의 버그 수정 및 개선 사항
버전 3.2.0의 새로운 기능 :
JSON 업데이트 개선이 이루어졌습니다.
검색 결과 클러스터링 및 UIMA 통합이 향상되었습니다.
버그가 수정되었습니다.
댓글을 찾을 수 없습니다