NVIDIA Grace CPU 슈퍼칩

NVIDIA Grace CPU

최신 데이터 센터를 위한 획기적인 CPU.

오늘날의 AI 데이터 센터의 성능과 효율성 수요를 충족하도록 설계되었습니다

NVIDIA Grace™ CPU는 방대한 양의 데이터를 처리하여 최대 에너지 효율로 인텔리전스를 생산하는 새로운 유형의 데이터 센터를 위해 설계되었습니다. 이러한 데이터 센터는 AI, 데이터 분석, 하이퍼스케일, 클라우드, 애플리케이션, 고성능 컴퓨터(HPC) 등 다양한 워크로드를 실행합니다. 가장 까다로운 데이터 센터 요구 사항을 충족하기 위해, Grace는 오늘날의 주요 서버와 비교했을 때 2배 향상된 와트당 성능, 2배 강력해진 패키징 밀도, 최고의 메모리 대역폭을 제공합니다.

Grace CPU는 고성능 및 전력 효율적인 Arm® Neoverse™ V2 코어 72개를 결합하였으며, 기존 CPU 대비 2배 수준인 3.2TB/s의 이등분 대역폭을 제공하는 NVIDIA Scalable Coherency Fabric(SCF)으로 연결되어 Arm 에코시스템과 완벽한 호환성을 유지하는 동시에 최대 성능을 제공합니다. Grace는 같은 비용으로 기존 DDR 메모리 대비 1/5에 해당하는 전력만 사용하여 최대 500GB/s의 대역폭을 제공해 드리는 광범위한 메모리 하위 시스템을 갖추고 서버급 고속 LPDDR5X 메모리를 활용한 최초의 데이터 센터 CPU입니다.

개발자를 위한 NVIDIA Grace CPU

NVIDIA Grace CPU 포트폴리오를 위해 제작된 개발자 도구를 살펴보세요. 리소스, 지침, 드라이버 등을 찾을 수 있습니다.

NVIDIA Grace CPU 소개

NVIDIA Grace CPU 슈퍼칩

Grace CPU 슈퍼칩은 NVIDIA NVLink™ 칩 투 칩(C2C)을 통해 900GB/s의 속도로 일관되게 연결된 2개의 Grace CPU로 구성되어 있습니다. 이 제품은 144개의 Neoverse V2 코어를 단일 모듈에 통합했으며 최대 1TB/s의 메모리 대역폭을 제공하는 서버급 LPDDR5X 메모리를 갖췄습니다. Grace CPU 슈퍼칩은 2소켓 서버를 중심으로 구성된 소형 모듈로, DDR5 메모리를 탑재한 기존 서버 CPU와 동일한 전력으로 2배의 성능을 제공합니다.

NVIDIA Grace CPU C1

NVIDIA Grace C1은 단일 소켓 고성능 서버 플랫폼으로, 성능이나 대역폭을 저하시키지 않는 하이퍼스케일 클라우드, CDN, 스토리지, 통신, 기타 고성능 엣지 플랫폼과 같이 확장 가능한 엣지 플랫폼을 위해 최적화되었습니다. 이 플랫폼은 뛰어난 x86 성능을 제공하며, 140W에서 250W 수준에서 Grace CPU와 LPDDR5X 메모리를 구성할 수 있습니다. 유사한 x86 플랫폼의 경우 400W 이상을 투입해야 합니다. NVIDIA가 설계한 Scalable Coherency Fabric 덕분에 Grace CPU는 선도적인 x86 플랫폼 대비 2배 높은 에너지 효율을 제공할 수 있습니다.

하이라이트

Grace CPU를 사용하면 데이터 센터의 출력을 2배로 늘리거나 에너지 사용량을 절반으로 줄일 수 있습니다

그래프 분석

3x

데이터 분석

2x

기상

2x

마이크로서비스

1.6x

NVIDIA LPDDR5X의 Grace 슈퍼칩 480GB, AMD DDR5의 EPYC 9654 768GB. 아래에 명시되지 않은 경우 OS: Ubuntu 22.04 컴파일러: GCC 12.3. 에너지 효율성 전력에는 CPU + 메모리 측정 전력이 포함됩니다. 그래프 분석: The Gap Benchmarks Suite BFS arXiv:1508.03619 [cs.DC], 2015. 데이터 분석: HiBench+K-means Spark(HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4) 기상: ICON QUBICC 80km resolution 24.5(Grace) ICC 2021.4(x86) 마이크로서비스: Google Protobufs(7cd0b6fbf1643943560d8a9fe553fd206190b27f 커밋 | N개 인스턴스 병렬 연결)

그래프 분석

NVIDIA Grace CPU 슈퍼칩은 Arm Neoeverse V2 코어와 맞춤형 NVIDIA Scaled Coherency Fabric을 연결합니다. 이 패브릭은 코어 간 통신과 동기화를 강화하는 GapBS Breadth First Search와 같은 워크로드에 놀랍도록 빠른 성능을 보여줍니다. NVIDIA Grace는 서버 수준에서 2배 이상 향상된 성능과 3배 개선된 에너지 효율을 제공합니다.

데이터 분석

데이터는 계속해서 증가하므로, 기업은 경쟁력을 위해 데이터로부터 학습을 극대화해야 합니다. HiBench 제품군은 지식 발견과 데이터 마이닝을 위한 K-평균 클러스터링을 테스트하고, NVIDIA Grace CPU의 고대역폭과 저전력 메모리를 활용합니다. Grace CPU는 오늘날 시장의 주요 x86 CPU와 비교했을 때 에너지 효율성이 2배 이상 뛰어납니다.

기상

기상 예측 모델은 고성능 컴퓨팅(HPC)의 중요한 사용 사례이며, 기후 변화로 인해 달라지고 있는 기상 패턴을 이해하고 대응하기 위한 필수 요소입니다. 고대역폭과 전력 효율적인 LPDDR5X 메모리를 사용하는 Grace CPU는 약 16W에 최대 500GB/s의 대역폭을 제공합니다. Grace는 기존 x86 솔루션과 비교했을 때 동일한 전력 포락선에서 2배에 가까운 작업을 완료할 수 있습니다.

마이크로서비스

마이크로서비스는 데이터 센터가 수요에 따라 쉽게 확장할 수 있도록 지원하는 소규모 독립 서비스 모음입니다. 이는 또한 전체 애플리케이션에 영향을 주지 않으면서도 개별 서비스를 관리할 수 있는 유연성을 제공합니다. Google Protobufs는 마이크로서비스 실행에 필수적인 시스템 간 데이터 교환에 필요한 데이터를 얼마나 빠르게 직렬화하고 파싱할 수 있는지를 측정합니다. 고성능 및 전력 효율성을 자랑하는 NVIDIA Grace CPU는 데이터 센터의 처리량을 극대화할 수 있도록 뛰어난 성능과 전력 효율성을 제공합니다.

기능

기술 혁신

Arm Neoverse V2 코어

Grace CPU의 핵심은 오늘날 시장에서 Arm이 선보이는 최고 성능의 데이터 센터 코어인 Arm Neoverse V2 CPU 코어입니다. Neoverse V2 코어는 기존 CPU와 비교했을 때 놀라운 효율성을 제공하면서도 뛰어난 코어당 성능을 제공하도록 최적화되었습니다. Grace CPU는 72개의 코어를 통합했습니다. 이 제품은 LPDDR5X 메모리와 결합될 때 NVIDIA Scaled Coherency Fabric을 통해 선도적인 x86 CPU와 동일한 전력 포락선에서 2배 이상의 성능을 선보입니다.

NVIDIA Scalable Coherency Fabric

NVIDIA Scalable Coherency Fabric(SCF)은 전력 및 면적 효율적인 방식으로 코어와 대역폭을 확장하는 작업의 난관을 극복하기 위해 NVIDIA가 설계한 메시 패브릭 및 분산 캐시 아키텍처입니다. SCF는 CPU 코어, 메모리, 시스템 I/O 사이의 데이터 흐름을 유지하기 위해 3.2TB/s 이상의 총 이등분 대역폭을 제공합니다. 이는 기존 CPU 대비 2배 수준입니다. SCF는 그래프 분석 등 데이터 이동량이 많은 애플리케이션에서 병목 현상을 줄여줍니다. 여기에서 NVIDIA Grace는 선도적인 x86 서버 대비 최대 2배 높은 성능을 제공합니다.

LPDDR5X 메모리

NVIDIA Grace는 오류 수정 코드(ECC)와 같은 메커니즘을 통해 서버급 안정성을 갖춘 LPDDR5X 메모리를 사용하는 최초의 서버 CPU입니다. NVIDIA Grace의 LPDDR5X 메모리는 비용, 전력, 대역폭, 용량 사양을 두루 갖췄습니다. 이 제품은 약 16W에 불과한 전력으로 최대 500GB/s의 성능을 제공하는데, 이는 기존 DDR5 메모리 대비 1/5 수준입니다.

단일 및 듀얼 소켓

NVIDIA Grace CPU 포트폴리오에는 144개의 Neoverse V2 코어와 듀얼 소켓 서버의 핵심을 제공하는 Grace 슈퍼칩이 포함되어 있으며, 이 단일 소형 모듈에 최대 960GB의 LPDDR5X까지 들어 있습니다. 이 제품은 CPU와 메모리에 단 500W만 필요합니다. 추가적인 유연성을 제공하기 위해 Grace CPU C1은 72개의 Neoverse V2 코어를 갖추고 놀랍도록 빠른 NVIDIA Scalable Coherency Fabric에 연결되어 클라우드, 스토리지, 엣지, 통신 배포에 최적화된 단일 소켓 구성으로 훌륭한 성능을 선보입니다. 이는 기존 x86 서버 대비 와트당 최대 2배의 성능을 제공합니다.

뉴스

세계적인 수준의 데이터 센터 성능과 획기적인 에너지 효율을 제공하는 NVIDIA Grace CPU

NVIDIA는 새로운 종류의 고성능 데이터 센터 CPU인 NVIDIA Grace CPU를 설계했습니다. 이 CPU는 획기적인 에너지 효율을 제공하기 위해 제작되었으며 데이터 센터 규모의 성능에 맞춰 최적화되었습니다.

Arm 소프트웨어 에코시스템을 통합한 NVIDIA Grace CPU

데이터 센터의 전력 제약이 점점 더 심각해지는 오늘날, 가급적 많은 워크로드를 가속화하고 나머지 부분은 최대한 효율적인 컴퓨팅을 통해 실행하는 것이 매우 중요합니다. Grace CPU는 가속 컴퓨팅과 CPU 전용 작업을 모두 처리하도록 최적화되어, 기존 CPU와 동일한 전력으로 최대 2배의 성능을 제공합니다.

스포트라이트: NVIDIA Grace CPU를 사용하여 저수지 시뮬레이션을 위한 선형 솔버를 가속화한 Petrobras

이 블로그는 NVIDIA Grace CPU가 해당 워크플로우 내에서 선형 시스템을 탁월하게 해결한 방법을 소개합니다. Petrobras는 다른 x86 기반 CPU와 비교했을 때 최대 4.5배 더 빠른 솔루션 시간과 4.3배 더 높은 에너지 효율성, 1.5배 더 높은 확장성을 달성했습니다.

사양

Grace CPU 사양

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate