ASPseek

소프트웨어 스크린 샷:
ASPseek
소프트웨어 정보:
버전: 1.2.10
업로드 날짜: 3 Jun 15
개발자: SWsoft
라이센스: 무료
인기: 4

Rating: nan/5 (Total Votes: 0)

ASPseek는 인터넷 검색 엔진 소프트웨어 SW 소프트가 개발하고 GNU GPL하에 무료 소프트웨어로 라이센스입니다.
ASPseek는 인덱싱 로봇, 검색 데몬 및 CGI 검색 프론트 엔드로 구성되어 있습니다. 그것은 몇 백만의 URL로 인덱스로 많은 수와 단어와 문구를 사용 와일드 카드를 검색하고, 부울 검색을 수행. 검색 결과는 시간, 사이트 또는 웹 공간 (사이트의 집합) 제공 및 관련 항목 별 정렬 제한 할 수 있습니다 (페이지 랭크 (PageRank)가 사용됩니다) 또는 날짜.
ASPseek는 (사이트, 웹 공백으로 결과를 그룹화, 스레드 인덱스, 비동기 DNS 조회) 여러 사이트에 최적화되어 있지만,뿐만 아니라 하나의 사이트에서 검색을 사용할 수 있습니다. ASPseek 한 번 인해 유니 코드 저장 모드 (예 : 중국어 멀티 바이트 인코딩을 포함)에서 여러 언어 / 인코딩 작업 할 수 있습니다. 다른 기능은 검색 결과, 발췌 및 강조 쿼리 단어에 대한 중지 단어와 ispell로 지원, 캐릭터 세트 및 언어를 추측, HTML 템플릿을 포함한다.
ASPseek는 STL 라이브러리를 사용하여 C ++로 작성하고, SQL 데이터베이스 및 스토리지에 대한 바이너리 파일의 조합을 사용합니다.
여기에 "ASPseek"의 일부 주요 기능은 다음과 같습니다
문서의 수백만을 통해 색인 및 검색 할 수있는 기능
 
· ASPseek를 사용하여 데이터베이스를 구축 할 수 많은 사이트를 통해 검색하고 각 쿼리에 대한 결과는 인덱스 문서의 몇 수백만이 있더라도 빨리 반환됩니다. 물론,이 하드웨어에 의존하므로 "옛"486 머신 .COM 도메인의 모든 사이트를 처리 할 것으로 예상하지 않는다. 모든 등 CPU (들), 메모리, 디스크 속도에 따라 달라집니다 그래서 당신 전에 자신의 시험은 전용 하드웨어를 구입 않습니다.
 
· ASPseek 높은 볼륨에 최적화되어 있다는 사실은 문서의 몇 백 포함 당신의 자신의 위치를​​ 검색하는 데 사용에서 당신을 중지해서는 안 - 그것뿐만 아니라이 작동합니다.
 
결과 아주 좋은 관련성
 
· 검색 엔진의 목적은 사용자가 원하는 것을 찾을 수 있습니다. 거기 검색 질의의 결과로서 발견 된 URL 수천 수 있지만 모든 무관 될 수 있으므로, 사용자는 불만족 할 것이다.
 
· ASPseek의 출력 결과는 관련성 (또는 등급)으로 분류하지만 순위 계산은 쉬운 일이 아니다 있습니다. 개발자는 좋은 검색 속도를 유지하면서 ASPseek 엔진에 가장 최신 기술을 통합하기 위해 최선을 시도했다.
 
ispell로 지원
 
· ASPseek는 ispell로 지원을 사용하는 경우, searchd (1) 선택적으로 지정된 모든 단어에 대한 모든 형태를 찾을 수 있습니다 (예 : 생성 -> 생성 또는 생성 만들거나). 그래서, 당신이 다른 형태의 모든 단어를 찾을 수 있습니다.
 
유니 저장 모드
 
· ASPseek는 유니 문서에 대한 정보를 저장 따라서 다국어 검색 엔진을 구현하는 것이 가능하게 할 수있다. 그래서, 당신은 인덱스 할 수 있고 영어로 문서를 검색, 러시아와 하나의 데이터베이스에있는 모든, 심지어 중국어.
 
HTTP, HTTPS, HTTP 프록시 (프록시를 통해) FTP 프로토콜
 
ASPseek는 웹 검색 엔진 ·이므로, 그것은 인덱스 사이트에 HTTP 프로토콜을 사용한다. ASPseek는 보안 HTTPS를 지원합니다 : // 프로토콜. FTP 프로토콜은 직접 지원되지 않습니다,하지만 당신은 프록시를 통해 (오징어 등) 프록시와 인덱스 FTP 사이트를 사용할 수 있습니다.
 
· ASPseek는 HTTP의 "기본 인증"기능을 사용하면 인덱스 암호로 보호 된 영역 (인트라넷 예를 들면 개인 정보) 할 수 있도록 지원합니다.
 
텍스트 / HTML과 텍스트 / 일반 문서 형식 지원
 
· ASPseek는 HTML로 작성된 문서 및 일반 텍스트 문서를 이해할 수있다. 다음은 인터넷에서 가장 인기있는 형식입니다.
 
· 등등 PDF, RTF, 같은 다른 포맷, 형식은 HTML 또는 일반 텍스트 것을 변환 할 수있는 외부 프로그램 / 스크립트의 도움으로 지원 될 수 있습니다.
 
멀티 스레드 디자인, 비동기 DNS 확인 등
 
· ASPseek는 하나의 프로세스가 병렬로 실행하는 많은 스레드를 가지고 있다는 것을 의미, POSIX 스레드를 사용합니다. 그래서 많은 사이트에서 인덱스 다운로드 문서 및 검색 데몬 프로세스 많은 검색 쿼리를 동시에. 이 ASPseek는 SMP (멀티 프로세서) 시스템에서 잘 확장하는 데 도움이,하지만 하나의 스레드의 경우에는 대부분의 시간은 네트워크의 데이터 대기에 소요되기 때문에 또한, 인덱싱 속도를 향상뿐만 아닙니다.
 
· 다운 많이 느린 인덱싱 프로세스는 DNS 룩업 (서버 이름을 사용하여 IP 어드레스를 결정하는 처리) 인 것이 한가지. 지연을 방지하기 위해, 비동기 조회 (조회가 별도의 전용 프로세스에 의해 수행) 및 IP 주소 캐시가 구현된다.
 
불용어
 
· 불용어는 그 자체로 의미가없는 단어입니다. 예 :,, 이것이다됩니다. 에서 검색하는 것은 쓸모없는, 그래서 같은 단어는 검색 쿼리에서 제외됩니다. 중지 단어는 인덱싱하는 동안 데이터베이스에서 제외되므로, 데이터베이스는 더 작고 더 빠른된다.
 
· ASPseek에는 "내장"중지 단어가 없습니다, 그들은 파일에서 시작시로드됩니다. 다른 언어에 대한 많은 스톱 워드 파일은 ASPseek와 함께 제공됩니다.
 
캐릭터 세트 guesse
 
· 일부 파손 또는 잘못 서버는 클라이언트에게 그들이 콘텐츠를 제공하는 문자 집합을 말하지 않습니다. 당신은 서버의 색인을 생성, 또는 (FTP 프로토콜이 캐릭터 세트에 대해 아무것도 몰라 않습니다) 인덱스 FTP 서버에 ASPseek를 사용하는 경우, 캐릭터 세트를 추측은 처리 할 수​​ 있습니다. 캐릭터 세트를 추측 해 올바른 캐릭터 세트를 결​​정하기 위해 단어 주파수 테이블 (라고 langmaps)를 사용합니다.
 
로봇 배제 표준 (robots.txt에) 지원
 
· ASPseek는 완전히이 표준을 지원합니다. 그것은 로봇 이야기에 대한 웹 사이트 제작자를위한 것입니다 (예를 들어, ASPseek의 인덱스 (1)) 자신의 사이트의 일부 디렉토리 색인을 건너 뜁니다.
 
· 자세한 내용은 참조하십시오 http://www.robotstxt.org/wc/robots.html
 
설정 네트워크 대역폭 사용량 및 웹 서버의 부하를 제어하도록
 
· 당신은 정확히 인덱스 (1) 사용하는 네트워크 대역폭을 제어 할 수 있습니다. 정확히, 당신은 주어진 시간의 일에 대한 인덱스 (1)에 의해 사용되는 (초당 바이트로 표현) 대역폭을 제한 할 수 있습니다. 사무실에 사람들이 느린 인터넷을 경험하지 않도록 예를 들어, 업무 시간 동안 대역폭을 제한 할 수 있습니다.
 
· 당신은 또한 같은 웹 서버에 두 개의 쿼리 사이의 최소 시간을 설정할 수 있습니다, 그래서 당신은 인덱스를 실행하면서 과부하가 아래로 무릎에있어되지 않습니다 (1).
 
실시간 비동기 색인
 
· 일부 검색 엔진은 검색 데이터베이스 갱신의 시간을 중지해야해야합니다. 당신이 직행을 검색 할 수 있도록 ASPseek는 필요하지 않습니다.
 
· 말을 더 많이, "실시간"색인이라고 색인의 특수 모드가있다. 당신은 문서의 작은 번호를 사용할 수 있으며, 같은 문서를 다운로드하여 처리 될 때까지, 변화는 검색 인터페이스에서 즉시 볼 수 있습니다. 당신이 등 온라인 뉴스 등 빠르게 변화하는 콘텐츠가 포함 된 페이지의 검색 엔진을 구축하는 경우이 기능은 큰 도움이됩니다
 
· 데이터베이스가 제한된다 "실시간"으로 문서의 번호를 확인합니다. 그것은 약 1000 (귀하의 마일리지가 다를 수 있습니다) 우리의 하드웨어를, 그리고 당신이 "실시간"데이터베이스에있는 더 많은 문서, 느린 그 (및 해당) 데이터베이스에 인덱싱 속도 될 것입니다. 하지만 이것은 검색 속도에 영향을주지 않습니다.
 
· "실시간"데이터베이스에서 문서는 일반적인 방법으로 (1) 인덱스를 실행 한 후 정상적인 데이터베이스로 이동됩니다.
 
관련성 또는 날짜별로 결과를 정렬
 
· 검색 엔진은 일반적으로 첫 번째 가장 관련성이 높은 결과를 반환합니다. 당신이 최신 페이지를 찾고 있다면, 당신은 최근에 페이지가 먼저 표시됩니다 수정 (또는 생성) 그래서, 마지막 수정 날짜를 기준으로 결과를 정렬 할 ASPseek를 알 수 있습니다.
 
강조 발췌, 쿼리 단어
· 발췌 단어를 찾을 문서의 조각이 강조를 위해, 단지 문서의 내용에 대해 알을 제공하는 검색됩니다. 당신은 표시 발췌과 길이의 수를 사용자 정의 할 수 있습니다. 당신이 발췌를 사용하지 않을 경우, 문서의 시작 부분이 표시됩니다.
 
· 모든 발견 된 문서는 "캐시"링크를 동반한다. 사용자가 (즉 때때로 발생) 원래 사이트에서 삭제 된 경우에도, (옵션)와 전체 문서를 참조하십시오, 검색 한 단어를 강조 할 수 있도록 ASPseek는 가공 모든 문서의 로컬 압축 복사본을 유지합니다.
 
사이트에 의해 그룹화 결과
 
· 하나의 사이트에서 결과를 함께 그룹화 할 수 있습니다. 사이트에서 그룹화하는 켜져있는 경우, 두 결과는 기본적으로 동일한 사이트에서 표시되고, 사용자가 링크 "에서 ... 더 많은 결과를"에 따라 같은 사이트에서 다른 페이지를 볼 수 있습니다.
 
클론
 
· 클론은 서로 다른 위치에서 동일한 문서입니다. 그들은 감지 그룹화, 그래서 사용자는 동일한 문서의 URL의 전체 페이지가 표시되지 않습니다 있습니다.
 
· 복제 탐지는 일반적으로 하나의 사이트에서 (클론으로 간주되지 않습니다 다른 사이트에서 그렇게 동일한 문서)에 의해 제한되어 있지만 --disable-클론 별 사이트 옵션 ASPseek을 재 컴파일하여이를 변경할 수 있습니다.
 
공간과 집합
 
· 공간이 사이트의 집합입니다. 당신은 몇 가지 영역으로 좁혀 검색을 제공하려는 경우에 따라서, 당신은 공간을 만들고 그 공간 내에서 검색 할 수 있습니다. 정수만 사이트 (예 http://www.mysite.com/) 공간에 포함되는 것이 허용된다.
 
· 서브 세트는 검색을 제한하는 데 사용될 수있다. 당신은 하위 집합을 만들고 해당로 (http://www.mysite.com/mydir/% 등) URL 마스크를 넣어 만 주어진 집합에 검색 범위를 제한 할 수 있습니다.
 
· 당신은 여러 부분 집합 또는 공간뿐만 아니라 하나의 검색 범위를 제한 할 수 있습니다.
 
쉬운 사용자 정의 검색 결과에 대한 HTML 템플릿
 
· 당신은 당신의 검색 페이지를 사용자 정의 할 수 있습니다, 그래서 그들은 모양을 원활 사이트의 나머지 부분과 통합 될 수있다. 이것은 검색 템플릿 파일의 간단한 편집에 의해 이루어집니다.
설치
GZIP -dc aspseek-1.2.10.tar.gz | 타르 XF -
CD의 aspseek-1.2.10. / 구성
확인
SU
설치 만든다

개발자의 기타 소프트웨어 SWsoft

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

OpenVZ kernel
OpenVZ kernel

2 Jun 15

Plesk for Windows
Plesk for Windows

22 Sep 15

코멘트 ASPseek

댓글을 찾을 수 없습니다
코멘트를 추가
이미지를 켜십시오!