O alicerce dos data centers de mais alto desempenho no mundo.
Resolvendo os maiores desafios científicos, industriais e empresariais do mundo com IA e HPC. Visualização de conteúdo complexo para criar produtos inovadores, histórias imersivas e reimaginar as cidades do futuro. Insights rápidos de grandes conjuntos de dados. A arquitetura NVIDIA Ampere, projetada para a era da computação elástica, enfrenta todos esses desafios, oferecendo uma aceleração incomparável.
Com 54 bilhões de transistores, a arquitetura NVIDIA Ampere é o maior chip de 7 nanômetros (nm) já construído e apresenta seis inovações revolucionárias.
Apresentada na arquitetura NVIDIA Volta™, a tecnologia NVIDIA Tensor Core acelerou significativamente a IA, reduzindo o tempo de treinamento de semanas para horas e fornecendo aceleração para inferência. A arquitetura NVIDIA Ampere aproveita essas inovações trazendo mais precisão: Tensor Float 32 (TF32) e Floating Point 64 (FP64) para acelerar e simplificar o uso de IA e estender a potência dos Núcleos Tensor para a HPC.
O TF32 funciona como o FP32, oferecendo velocidades de até 20 vezes para IA sem exigir alteração de código. Com o NVIDIA Automatic Mixed Precision, os pesquisadores podem ter o dobro de desempenho com precisão mista automática e FP16 adicionando apenas algumas linhas de código. E com o suporte para bfloat16, INT8 e INT4, os Núcleos Tensor nas GPUs Tensor Core da arquitetura NVIDIA Ampere criam um acelerador versátil para treinamento e inferência de IA. Com a potência dos Núcleos Tensor para HPC, as GPUs A100 e A30 permitem operações de matriz com precisão FP64 certificada pela IEEE.
A aceleração é útil para todas as aplicações de IA e HPC, mas nem todas precisam do desempenho de uma GPU completa. A GPU Multi-Instância (MIG) é compatível com GPUs A100 e A30, permitindo compartilhamento de GPU. Com MIG, cada GPU pode ser particionada em várias instâncias totalmente isoladas e protegidas no nível de hardware com sua própria memória de alta largura de banda, cache e core. Os desenvolvedores têm acesso a uma aceleração nunca vista, para aplicações de pequena e grande escala, com qualidade garantida. Administradores de IT podem oferecer aceleração de GPU na escala adequada, otimizando operações e expandindo o acesso a todos os usuários e aplicações em ambientes bare-metal e virtualizados.
Escalabilidade em várias GPUs requer uma movimentação extremamente rápida de dados. O NVIDIA® NVLink® de 3ª geração na arquitetura Ampere dobra a largura de banda direta GPU-to-GPU para 600 gigabytes/segundo (GB/s), quase 10 vezes mais que o PCIe de 4ª Geração. Combinadas com a geração mais recente do NVIDIA NVSwitch™, todas as GPUs no servidor conversam na velocidade máxima do NVLink, transferindo dados de forma rápida.
O NVIDIA DGX™A100 e servidores de outros fabricantes aproveitam a tecnologia NVLink e NVSwitch por meio das placas base NVIDIA HGX™ A100 para oferecer maior escalabilidade para HPC e IA.
As redes modernas de IA são grandes e aumentarão, com milhões e até bilhões de parâmetros. Nem todos estes parâmetros são necessários para previsões precisas, e alguns podem ser convertidos em zeros, tornando os modelos mais "dispersos" sem afetar a precisão. Núcleos Tensor podem dar desempenho até 2 vezes maior para modelos dispersos. Embora esparsidade ou dispersão beneficie a inferência de IA, também pode ajudar a melhorar o desempenho ao treinar modelos.
Os Núcleos RT de 2ª geração da arquitetura NVIDIA Ampere na NVIDIA A40 oferecem grandes acelerações, como renderização fotorrealista de conteúdo de filmes, avaliações de designs arquitetônicos e prototipagem virtual de designs de produtos. Núcleos RT também aceleram a renderização de ray-traced motion blur para resultados mais rápidos e precisos, e podem executar ray tracing com recursos de sombreamento ou redução de ruído.
A A100 traz grandes quantidades de computação para data centers. Para aproveitar totalmente esses mecanismos, possui largura de banda de memória de 2 terabytes por segundo (TB/seg), mais que o dobro da geração anterior. Além disso, a A100 tem muito mais memória no chip, incluindo um cache de nível 2 de 40 megabytes (MB) (7 vezes maior que a geração anterior) para maximizar o desempenho.
As ofertas de GPU e aceleradores convergentes da NVIDIA são projetadas para implantação em escala, com rede, segurança e economia de espaço para nuvem, data center e edge.
Com a menor área ocupada do portfólio, a GPU NVIDIA A2 é otimizada para inferência e implantações em servidores de nível básico restritos por requisitos de espaço e térmicos, como ambientes industriais e 5G no edge. O A2 oferece um formato compacto que opera em ambiente de baixa potência, com uma potência de design térmico (TDP) de 60W a 40W, ideal para qualquer servidor.
Nos aceleradores convergentes da NVIDIA, a arquitetura NVIDIA Ampere e a unidade de processamento de dados (DPU) NVIDIA BlueField®-2 se unem com desempenho sem precedentes, segurança e rede aprimoradas para trabalhos impulsionados por GPU em computação no edge e telecomunicações. A BlueField-2 combina a potência do NVIDIA ConnectX®-6 Dx com núcleos Arm® programáveis e descargas de hardware para armazenamento, rede, segurança e gerenciamento definido por software. Os aceleradores convergentes da NVIDIA permitem um novo nível de eficiência e segurança do data center trabalho de rede intensivo e acelerado por GPU.
A GPU NVIDIA A16 vem em um design de placa de quatro GPUs otimizado para densidade de usuários e, com o software NVIDIA Virtual PC (vPC), permite PCs virtuais ricos em gráficos acessíveis em qualquer lugar. Oferece uma taxa de quadros maior e latência menor para o usuário final em comparação com a VDI CPU-only com NVIDIA A16, resultando em aplicações mais responsivas e experiência de usuário indistinguível de um PC nativo.
As implantações seguras são cruciais para operações empresariais. A arquitetura NVIDIA Ampere oferece inicialização segura por autenticação de código confiável e proteções reforçadas contra ataques de malware, evitando perdas operacionais e garantindo a aceleração das cargas de trabalho.
Conheça a Arquitetura NVIDIA Ampere
Explore as tecnologias de ponta da arquitetura NVIDIA Ampere.