Arquitetura NVIDIA Ampere

O alicerce dos data centers de mais alto desempenho no mundo.

Essencial para IA e HPC no Data Center Moderno

Resolvendo os maiores desafios científicos, industriais e empresariais do mundo com IA e HPC. Visualização de conteúdo complexo para criar produtos inovadores, histórias imersivas e reimaginar as cidades do futuro. Insights rápidos de grandes conjuntos de dados. A arquitetura NVIDIA Ampere, projetada para a era da computação elástica, enfrenta todos esses desafios, oferecendo uma aceleração incomparável.

Inovações Revolucionárias

Com 54 bilhões de transistores, a arquitetura NVIDIA Ampere é o maior chip de 7 nanômetros (nm) já construído e apresenta seis inovações revolucionárias.

Núcleos Tensor de 3ª Geração

Apresentada na arquitetura NVIDIA Volta™, a tecnologia NVIDIA Tensor Core acelerou significativamente a IA, reduzindo o tempo de treinamento de semanas para horas e fornecendo aceleração para inferência. A arquitetura NVIDIA Ampere aproveita essas inovações trazendo mais precisão: Tensor Float 32 (TF32) e Floating Point 64 (FP64) para acelerar e simplificar o uso de IA e estender a potência dos Núcleos Tensor para a HPC.

O TF32 funciona como o FP32, oferecendo velocidades de até 20 vezes para IA sem exigir alteração de código. Com o NVIDIA Automatic Mixed Precision, os pesquisadores podem ter o dobro de desempenho com precisão mista automática e FP16 adicionando apenas algumas linhas de código. E com o suporte para bfloat16, INT8 e INT4, os Núcleos Tensor nas GPUs Tensor Core da arquitetura NVIDIA Ampere criam um acelerador versátil para treinamento e inferência de IA. Com a potência dos Núcleos Tensor para HPC, as GPUs A100 e A30 permitem operações de matriz com precisão FP64 certificada pela IEEE.

GPU Multi-Instância (MIG)

A aceleração é útil para todas as aplicações de IA e HPC, mas nem todas precisam do desempenho de uma GPU completa. A GPU Multi-Instância (MIG) é compatível com GPUs A100 e A30, permitindo compartilhamento de GPU. Com MIG, cada GPU pode ser particionada em várias instâncias totalmente isoladas e protegidas no nível de hardware com sua própria memória de alta largura de banda, cache e core. Os desenvolvedores têm acesso a uma aceleração nunca vista, para aplicações de pequena e grande escala, com qualidade garantida. Administradores de IT podem oferecer aceleração de GPU na escala adequada, otimizando operações e expandindo o acesso a todos os usuários e aplicações em ambientes bare-metal e virtualizados.

Esparsidade Estrutural

As redes modernas de IA são grandes e aumentarão, com milhões e até bilhões de parâmetros. Nem todos estes parâmetros são necessários para previsões precisas, e alguns podem ser convertidos em zeros, tornando os modelos mais "dispersos" sem afetar a precisão. Núcleos Tensor podem dar desempenho até 2 vezes maior para modelos dispersos. Embora esparsidade ou dispersão beneficie a inferência de IA, também pode ajudar a melhorar o desempenho ao treinar modelos.

RT Cores de 2ª Geração

Os Núcleos RT de 2ª geração da arquitetura NVIDIA Ampere na NVIDIA A40 oferecem grandes acelerações, como renderização fotorrealista de conteúdo de filmes, avaliações de designs arquitetônicos e prototipagem virtual de designs de produtos. Núcleos RT também aceleram a renderização de ray-traced motion blur para resultados mais rápidos e precisos, e podem executar ray tracing com recursos de sombreamento ou redução de ruído.

Memória Mais Inteligente e Mais Rápida

A A100 traz grandes quantidades de computação para data centers. Para aproveitar totalmente esses mecanismos, possui largura de banda de memória de 2 terabytes por segundo (TB/seg), mais que o dobro da geração anterior. Além disso, a A100 tem muito mais memória no chip, incluindo um cache de nível 2 de 40 megabytes (MB) (7 vezes maior que a geração anterior) para maximizar o desempenho.

Otimizado Para Crescer

As ofertas de GPU e aceleradores convergentes da NVIDIA são projetadas para implantação em escala, com rede, segurança e economia de espaço para nuvem, data center e edge.

Energia Otimizada para Qualquer Servidor

Com a menor área ocupada do portfólio, a GPU NVIDIA A2 é otimizada para inferência e implantações em servidores de nível básico restritos por requisitos de espaço e térmicos, como ambientes industriais e 5G no edge. O A2 oferece um formato compacto que opera em ambiente de baixa potência, com uma potência de design térmico (TDP) de 60W a 40W, ideal para qualquer servidor.

Aceleração de Computação e Rede Unificada

Nos aceleradores convergentes da NVIDIA, a arquitetura NVIDIA Ampere e a unidade de processamento de dados (DPU) NVIDIA BlueField®-2 se unem com desempenho sem precedentes, segurança e rede aprimoradas para trabalhos impulsionados por GPU em computação no edge e telecomunicações. A BlueField-2 combina a potência do NVIDIA ConnectX®-6 Dx com núcleos Arm® programáveis e descargas de hardware para armazenamento, rede, segurança e gerenciamento definido por software. Os aceleradores convergentes da NVIDIA permitem um novo nível de eficiência e segurança do data center trabalho de rede intensivo e acelerado por GPU.

Design Otimizado de Densidade

A GPU NVIDIA A16 vem em um design de placa de quatro GPUs otimizado para densidade de usuários e, com o software NVIDIA Virtual PC (vPC), permite PCs virtuais ricos em gráficos acessíveis em qualquer lugar. Oferece uma taxa de quadros maior e latência menor para o usuário final em comparação com a VDI CPU-only com NVIDIA A16, resultando em aplicações mais responsivas e experiência de usuário indistinguível de um PC nativo.

Implantações Seguras

As implantações seguras são cruciais para operações empresariais. A arquitetura NVIDIA Ampere oferece inicialização segura por autenticação de código confiável e proteções reforçadas contra ataques de malware, evitando perdas operacionais e garantindo a aceleração das cargas de trabalho.

Conheça a Arquitetura NVIDIA Ampere

Explore as tecnologias de ponta da arquitetura NVIDIA Ampere.