WebGraph 웹 그래프를 연구하는 프레임 워크이다. WebGraph 현대 압축 기술을 활용 매우 큰 그래프를 관리 할 수있는 간단한 방법을 제공합니다. 보다 구체적으로, 현재는 제조된다 :
1. (특정 지수 범위에서 일반적으로, 또는, 지수 법칙 분포 정수) 특히 웹 그래프를 저장하기에 적합한 코드라는 플랫 코드의 집합. 이러한 코드가 잘 작동한다는 사실은 경험적으로 용이하게 테스트 될 수 있지만, 우리는 또한 상세한 수학적 분석을 제공하기 위해 노력.
2. 알고리즘 갭 압축 및 referentiation (LA LINK)를 이용하는 웹 그래프를 압축, intervalisation 부호화함으로써 높은 압축률을 제공한다 : 예를 들어, WebBase 그래프 (2001 크롤링) 링크 당 3.08 비트로 압축 및 스냅 샷 의 UbiCrawler에 의해 수집 된 영국 도메인의 약 18,500,000 페이지 링크 당 2.22 비트에서 압축 (전치 그래프에 해당하는 수치는 링크 당 2.89 비트와 링크 당 1.98 비트이다). 알고리즘이 액세스 속도와 압축비 사이의 상이한 트레이드 오프를 제공하는 몇 가지 변수에 의해 제어된다.
실제로, 압축 해제 실제로 필요할 때까지 감압 지연 지연 기술을 사용하지 않고 압축 된 그래프 3. 액세스하기위한 알고리즘.
패키지 it.unimi.dsi.webgraph에 포함 된 자바에서 위의 알고리즘 4. 완전한 문서화의 구현입니다. 명확하게 정의 된 API 외에, 패키지는 매우 다양한 설정 실험, 그래프를 수정 (예를 들어, 트랜스) 또는 다시 압축 할 수있는 몇 가지 클래스가 포함되어 있습니다. 이 패키지는 즉시 사용, 효율적인 알고리즘 및 라인 명령 구문 분석 용 GNU getopt는에 COLT 분포, 비트 수준의 I / O에 대한 MG4J에, 유형별, 고성능 컬렉션 프레임 워크에 대한 fastutil에 의존합니다.
매우 큰 그래프 5. 데이터 세트 (예를 들어, 링크 억). 이들은 하나 공개 소스 (예 : WebBase 등)를 수집, 또는 UbiCrawler에 의해 생산된다.
결국, WebGraph와 함께 당신도 RAM의 적은 256 메가 바이트와 PC에 액세스하고 매우 큰 웹 그래프를 분석 할 수 있습니다. WebGraph를 사용하여 몇 가지 jar 파일을 설치하고 데이터 세트를 다운로드하는 것만 큼 쉽습니다. 이것은 페이지 랭크 (PageRank), 웹 그래프의 그래프 특성 등을 매우 쉽게 배포 등의 현상을 연구한다
이 릴리스의 새로운 기능입니다 무엇 : 있습니다.
이 버전은 HyperANF 몇 가지 개선을 추가 , 그리고 몇 가지 버그 수정.
WebGraph 이제 메이븐 중앙에서 찾을 수 있습니다.
이 어떤 버전 2.4.5에서 새로운 것은
이 버전을 계산 HyperANF, 그래프의 이웃 함수를 계산하기위한 새로운 확장 성이 뛰어난 알고리즘 및 방법의 구현을 포함 평균 최단 경로 동네 기능에서 다른 파생 데이터.
또한, 통계 데이터의 재산은 이제 압축시 계산됩니다.
이 버전 2.4.4의 새로운 기능 :
이 이전의 일부 옵션이 제거되었습니다.
등록 정보 파일은 이제 유용한 통계의 수많은 정보가 들어 있습니다.
랜덤 액세스 속도가 개선되었습니다.
이 버전 2.4.3의 새로운 기능 :
이 고정 ArrayListMutableGraph.addNodes () (발견하고이 버그를 고정 에릭 Lumer 덕분에).
새 옵션 ASCII 그래프의 출력을 이동합니다.
RemappedImmutableGraph.successorArray (X)는 이렇게 병렬 다른 목록에 스캔 할 상속 후계자 (x)의 방법을 사용할 수 없게 모든 호출에 같은 배열을 제공했다. 고정 (지금 대신, 어레이의 카피를 돌려).
랜덤 그래프의 순서를 무작위로 바꾸어 넣습니다 새로운 임의의 변형.
이 버전 2.4.2의 새로운 기능 :
이 새로운 & quot; 구성 & quot; 구성이 가능 (호 표지) 그래프를 구성 할 수 있습니다.
댓글을 찾을 수 없습니다