DataFu가 링크드 인에서 개발 된 자바로 작성되어있다.
DataFu이 작업을위한 기능 / 라이브러리를 포함한다 :
- 통계
- 평가
- 샘플링
- 세션
- 링크 분석
- 설정 작업
- 가방
DataFu 데이터 마이닝 및 하둡 또는 돼지 데이터베이스의 상단 작업 통계 응용 프로그램에 적합합니다.
이 기능은 개발자가 그렇게하기 위해 대규모 시스템 요구 사항을 처리 할 필요없이 하둡 또는 돼지 데이터베이스 내부에 저장된 모든 데이터를 최대한 활용할 수 있습니다.
어떻게 새로운 이 릴리스 : 교체와 간단한 무작위 표본 추출에 대한 UDF에의
쌍입니다.
적은 JAR 종속성이 필요하므로 더 많은 의존성 지금 DataFu에 포장.
설정된 차이를 계산 SetDifference UDF (예를 들어 A-B 또는 A-B-C).
이 버전 1.2.0의 새로운 기능입니다 :
이 교체 간단한 무작위 표본 추출에 대한 UDF에의 쌍입니다.
적은 JAR 종속성이 필요하므로 더 많은 의존성 지금 DataFu에 포장.
설정된 차이를 계산 SetDifference UDF (예를 들어 A-B 또는 A-B-C).
이 버전 1.1.0의 새로운 기능입니다 :
이 추가 된 SHA 해시 UDF.
InUDF 및 AssertUDF는 돼지 0.12 호환성을 위해 추가되었습니다. 여기에서하고 어설와 동일합니다.
확장 가능한 단순 무작위 표본 추출 알고리즘을 구현 SimpleRandomSample.
댓글을 찾을 수 없습니다