호남 석유 화학 과제는 높은 성능 벤치 마크 제품군입니다. HPC 챌린지는 기본적으로 7 벤치 마크 구성되어 있습니다 :
1. HPL - 방정식의 선형 시스템을 해결하기 위해 실행 부동 소수점 율을 측정 린팩 TPP 기준.
2. DGEMM은 - 배정도 실수 행렬 - 행렬 승산 실행 부동 소수점 속도를 측정한다.
3. STREAM - (GB / s의에서) 지속 가능한 메모리 대역폭을 측정하는 간단한 합성 벤치 마크 프로그램과 간단한 벡터 커널에 해당하는 연산 속도.
4. PTRANS (병렬 행렬 전치) - 프로세서 쌍들이 동시에 서로 통신하는 통신 운동. 이것은 네트워크의 전체 통신 용량 유용한 테스트이다.
5. RandomAccess를 - 조치 메모리의 정수 임의 업데이트 (GUPS)의 비율.
6. FFTE는 - 배정도 착체 일차원 이산 푸리에 변환 (DFT)의 실행 부동 소수점 속도를 측정한다.
7. 통신 대역폭 및 대기 시간 - 지연과 동시 통신 패턴의 수의 대역폭을 측정하는 테스트 세트; b_eff (유효 대역폭 벤치 마크)를 기반으로.
컴파일 :
첫 번째 단계는 시스템의 특성을 반영한 구성 파일을 생성하는 것이다. 구성 파일은 HPL 디렉토리에 작성해야한다. 이 디렉토리는 구성 파일을 작성하는 방법에 대해 설명합니다 (파일이 README와 INSTALL)가 포함되어 있습니다. 디렉토리 HPL / 설정은 환경 설정 파일의 많은 예제가 들어 있습니다. 양호한 접근법은 HPL 디렉토리 중 하나를 복사하고 작동하지 않는 경우 그것을 변경. 이 파일은 HPC Challange 제품군의 모든 구성 요소에 의해 다시 사용됩니다.
구성이 완료되면, 파일 이름이 만들기로 시작하는 HPL 디렉토리에 존재해야한다. 및 시험에 사용되는 시스템의 이름으로 끝난다. 시스템의 이름은 유닉스 인 경우, 예를 들어, 파일 make.unix에서 명명한다.
(유닉스라는 이름의 시스템에 대한) 벤치 마크 실행 파일을 작성하려면 다음을 입력 : 아치 = 유닉스을합니다. 이 명령은 상위 디렉토리 (안 HPL 디렉토리)에서 실행해야합니다. 이는 구성 파일 HPL 디렉토리에보고 기준 실행 파일을 작성하는 데 사용한다.
구성 :
HPC Challange 거의 (관습 HPL.dat 불림) HPL위한 입력 파일과 동일 짧은 입력 파일 이름 hpccinf.txt에 의해 구동된다. HPL의 입력 파일에 대한 자세한 내용은 파일 HPL / www /에서 tuning.html를 참조하십시오. 샘플 입력 파일은 HPC Challange 배포에 포함되어 있습니다.
다음 HPL 입력 파일과 HPC Challange 입력 파일의 차이는 요약 될 수있다 :
* 라인 3과 4는 무시됩니다. 출력은 항상 hpccoutf.txt라는 이름의 파일로 이동합니다.
HPC 챌린지 벤치 마크를 정의하는 데 사용 (하지만 필요가 없습니다) 수 (라인 (33)로 시작하는) 추가 행이 * 있습니다. 그들은 아래에 설명되어 있습니다.
(HPL 입력 파일에 비해) HPC 챌린지 입력 파일의 추가 라인은 다음과 같습니다 :
라인 (33, 34)가 추가적인 행렬의 크기를 설명은 PTRANS 기준 (HPC Challange 기준의 구성 요소 중 하나)를 실행하는 데 사용된다.
* 라인 (35, 36)가 추가로 차단 요소를 설명은 PTRANS 기준을 실행하는 데 사용된다.
그냥 완전성을 위해, 여기에 그 의미에 대한 간단한 설명과 함께 호남 석유 화학 Challange의 입력 파일의 라인의 목록입니다 :
* 1 호선 : 무시
* 2 호선 : 무시
* 3 호선 : 무시
* 4 호선 : 무시
* 5 호선 : HPL (과 PTRANS)에 대한 매트릭스 크기의 수
* 행 6 : HPL (과 PTRANS)에 대한 매트릭스 크기
* 7 호선 : HPL (과 PTRANS)에 대한 차단 요소의 수
* 행 8 : HPL (과 PTRANS)을 위해 요인 차단
* 9 호선 : HPL에 대한 처리 순서의 유형
* 행 10 : HPL (과 PTRANS)에 대한 프로세스 그리드의 수
* 행 11 : HPL에 대한 각각의 프로세스 그리드의 프로세스 행의 수 (및
PTRANS)
* 행 12 : HPL에 대한 각각의 프로세스 그리드의 공정 열 번호
(그리고 PTRANS)
* 행 13 : 임계 값에 대한 스케일 잔류를 초과 할 수 없습니다
HPL (그리고 PTRANS)
* 행 14 : HPL에 대한 패널 인수 분해 방법의 수
* 행 15 : HPL에 대한 패널 인수 분해 방법
* 행 16 : HPL에 대한 순환 정지 기준의 수
* 행 17 : HPL에 대한 순환 정지 기준
* 행 18 : 재귀 패널의 수는 HPL에 대한 계산
* 행 19 : 재귀 패널 HPL에 대한 계산
* 행 20 : HPL에 대한 재귀 패널 인수 분해 방법의 수
* 행 21 : HPL에 대한 재귀 패널 인수 분해 방법
* 행 22 : HPL에 대한 방송 방법의 수
* 행 23 : HPL에 대한 방송 방법
* 행 24 : HPL에 대한 예견 깊이의 수
* 행 25 : HPL을 찾아 미리 깊이
* 행 26 : HPL에 대한 스왑 방법
* 행 27 : HPL에 대한 임계 값을 교환
* 행 28 : HPL에 대한 (L1)의 형태로
* 행 29 : HPL에 대한 U의 형태로
* 행 30 : 값 평균을 사용할지 여부를 지정합니다
HPL로
* 행 31 : HPL에 대한 메모리 정렬
* 행 32 : 무시
* 행 33 : 추가 문제의 수는 PTRANS에 대한 크기
* 행 34 : 추가 문제가 PTRANS에 대한 크기
* 행 35 : PTRANS에 대한 추가 차단 요소의 수
* 행 36 : PTRANS에 대한 추가 차단 요인
이 릴리스의 새로운 기능입니다 :
이 버전은 난수 생성을위한 선형 합동 생성기를 사용 RandomAccess를 변형 최적화 덧붙였다.
전세계의 감소는 더 정확한 에러 추정치를 얻기 위해 MPI FFT 계산에 오류를 첨가 하였다.
HPL 컴포넌트가 마지막으로 실행 및 다른 부품의 성능이 만족스럽지 있었다면 중단 될 수 있도록 기준의 순서는 재 배열 하였다.
RandomAccess를 코드 조정을 지원하기 위해 현재 제이다.
모듬 버그가 수정되었습니다.
댓글을 찾을 수 없습니다