Agentes de IA para Análise de Vídeos com Tecnologia de IA Generativa

Descubra uma coleção de workflows de referência que usam Modelos de Linguagem Visual (VLM) para oferecer recursos robustos e interativos de percepção visual para uma ampla variedade de setores.

Comece Agora

Workloads

Visão Computacional / Análise de Vídeos

Setores

Manufatura
Cidades/Espaços Inteligentes
Varejo/Bens de Consumo Embalados
Mídia e Entretenimento
Área da Saúde e Ciências da Vida

Objetivo de Negócios

Retorno de Investimento
Inovação

Produtos

NVIDIA Metropolis
NVIDIA AI Enterprise
NVIDIA Cosmos Reason

Visão Geral

Impulsione Uma Nova Onda de Aplicações

As aplicações tradicionais de análise de vídeo e seus workflows de desenvolvimento são normalmente criados em modelos de função fixa e limitados que são projetados para detectar e identificar apenas um conjunto seleto de objetos predefinidos. Com IA generativa e modelos base, agora você pode criar aplicações com menos modelos que têm percepção incrivelmente complexa e ampla, além de compreensão contextual rica. Essa nova geração de modelos de linguagem visual (VLMs), como o NVIDIA Cosmos™ Reason, está gerando agentes de IA inteligentes e poderosos para análise de vídeo.

O Que É um Agente de IA de Análise de Vídeo?

Um agente de IA de análise de vídeo pode combinar modalidades de visão e linguagem para entender prompts de linguagem natural e realizar respostas visuais de perguntas. Por exemplo, respondendo a uma ampla variedade de perguntas em linguagem natural que pode ser aplicada em um stream de vídeo gravado ou ao vivo. Essa compreensão mais profunda do conteúdo de vídeo permite interpretações mais precisas e significativas, melhorando a funcionalidade das aplicações de análise de vídeo e a análise de cenários reais. Esses agentes prometem desbloquear insights e possibilidades totalmente novos para automação.

Simplifique Todas as Operações Industriais

Os agentes de IA para análise de vídeo altamente perceptivos, precisos e interativos serão implantados em nossas fábricas, armazéns, lojas de varejo, aeroportos, cruzamentos de tráfego e muito mais. Isso terá um grande impacto nas equipes de operações que buscam tomar melhores decisões usando insights mais completos, gerados a partir de interações naturais. Gerentes e equipes de operações se comunicarão com esses agentes em linguagem natural, todos com tecnologia de IA generativa e VLMs, com microsserviços NVIDIA NIM™ como fundamento.

Links Rápidos

Leia o Blog Criando Espaços Mais Seguros: NVIDIA e Parceiros Levam IA Física para Cidades e Infraestrutura Industrial

Leia o Blog: Blueprint de IA para Pesquisa e Resumo de Vídeo Agora Disponível para Implantar Agentes de IA Visual em Todos os Setores

Implementação Técnica

Desenvolva com NVIDIA NIM

O NVIDIA NIM é um conjunto de microsserviços de inferência que inclui APIs padrão do setor, código específico de domínio, mecanismos de inferência otimizados e tempo de execução empresarial. Oferece uma combinação de VLMs, LLMs e RAG para a criação de seu agente de IA para análise de vídeo que pode processar imagens ou vídeos ao vivo ou arquivados para extrair informações práticas usando linguagem natural. Criamos um workflow de referência de um agente de IA de análise de vídeo que você pode experimentar para acelerar seu processo de desenvolvimento.

Links Rápidos

Experimente o Workflow de Referência de Agentes de IA para Análise de Vídeo.

Leia o Blog Sobre a Construção de Agentes de IA para Análise de Vídeo Multimodal com tecnologia NVIDIA NIM

Crie Agentes de IA com NVIDIA AI Blueprint

O NVIDIA AI Blueprint para pesquisa e resumo de vídeo (VSS) facilita a criação e a personalização de agentes de IA para análise de vídeo usando IA generativa, VLMs, LLMs e tecnologia NVIDIA NIM. Os agentes de IA para análise de vídeo recebem tarefas por meio de linguagem natural e podem analisar, interpretar e processar grandes quantidades de dados de vídeo para fornecer perspectivas críticas que ajudam vários setores a otimizar processos, melhorar a segurança e reduzir custos.

O VSS permite a integração perfeita de IA generativa em pipelines de visão computacional existentes, aprimorando a inspeção, pesquisa e análise com compreensão multimodal e raciocínio zero-shot. Você pode implantar facilmente do edge à cloud em plataformas, como NVIDIA RTX PRO™ 6000, NVIDIA DGX™ Spark e NVIDIA® Jetson Thor™.

Conheça o blueprint no catálogo de APIs.

Links Rápidos

Experimente o Blueprint no Catálogo de APIs

Experimente o Blueprint na Cloud com o Launchable

Leia o Blog: Agentes de IA Avançada em Análise de Vídeo Usando o NVIDIA AI Blueprint para Pesquisa e Resumo de Vídeos

Leia o Blog : Aumentando seus Pipelines de Visão Computacional com IA Generativa

Crie Agentes de Edge com Serviços da Plataforma Jetson

Você pode criar agentes de IA para análise de vídeos com a tecnologia da plataforma de IA no edge NVIDIA Jetson™ usando o mais novo recurso do NVIDIA JetPack™: os serviços da plataforma Jetson. A aplicação de IA generativa está totalmente em execução em um dispositivo NVIDIA Jetson Orin™ que é capaz de detectar eventos para gerar alertas e facilitar sessões interativas de perguntas e respostas.

Links Rápidos

Faça o Download do Workflow de Referência para Jetson

Blog de Tecnologia: Desenvolva Agentes de IA para Análise de Vídeos com Tecnologia de IA Generativa para Edge

Perguntas Frequentes

O NVIDIA NIM é um conjunto de microsserviços fáceis de usar, projetados para uma implantação segura e confiável de inferência de modelos de IA de alto desempenho em cloud, data centers e workstations. É compatível com uma ampla variedade de modelos de IA, incluindo a comunidade de código aberto e os modelos base de IA da NVIDIA, para garantir uma inferência de IA perfeita e escalável, no local ou em cloud, usando APIs padrão do setor. Todos os microsserviços NIM e as APIs de pré-visualização associadas podem ser encontrados em build.nvidia.com.

Acesse build.nvidia.com para criar uma conta e começar a explorar os microsserviços NIM disponíveis. Você pode conferir o NVIDIA Cosmos Reason VLM NIM.

Experimente o NVIDIA AI Blueprint para pesquisa e resumo de vídeos gratuito.

Todos os usuários podem começar gratuitamente com as APIs de pré-visualização em build.nvidia.com. Cada nova conta pode receber até 5.000 créditos para experimentar as APIs. Para continuar o desenvolvimento após o esgotamento dos créditos, você pode implantar os microsserviços NIM disponíveis para download localmente em seu hardware ou em uma instância de nuvem. Os desenvolvedores também podem acessar o NIM por meio do Programa de Desenvolvedores da NVIDIA. Veja os detalhes no FAQ.

O NVIDIA NIM é gratuito para os desenvolvedores experimentarem. Para entrar em produção após o período de teste, os microsserviços NIM disponíveis para download exigem uma Licença de IA da NVIDIA Enterprise. Para saber mais, visite esta página.

O fórum de desenvolvedores NIM é o melhor lugar para fazer perguntas e interagir com nossa comunidade de desenvolvedores. Você pode acessar os fóruns aqui.

Comece Agora

Crie Agentes de IA para Análise de Vídeo

Explore o workflow de referência, com vários modelos de linguagem visual, para criar facilmente seu agente de IA para análise de vídeos.

Experimente Modelos de Linguagem Visual (VLM)

Conheça o AI Blueprint

Desenvolvedores em Ação

Blog Técnico
Vídeos do GTC On Demand

Crie Agentes de IA para Análise Avançada de Vídeo

Saiba como criar perfeitamente um agente de IA para análise de vídeo usando o NVIDIA AI Blueprint para pesquisa e resumo de vídeos (VSS).

Leia o Blog Parte 1 Leia o Blog Parte 2

Aumente os Pipelines de Visão Computacional com IA Generativa

Explore os novos recursos do VSS 2.4, incluindo a verificação de eventos, a integração com o Cosmos Reason e o suporte expandido a hardware.

Leia o Blog

Crie um Workflow de Vídeo com IA Baseada em Agentes

Saiba como criar um workflow com entrada de áudio, saída de fala para pesquisa de vídeos e resumo.

Leia o Blog

Crie Aplicações XR Multimodais em Tempo Real

Saiba como usar o NVIDIA AI Blueprint para pesquisar e resumir vídeos, oferecendo suporte a áudio em um ambiente de XR.

Leia o Blog

Veja Todos os Posts de Blog Sobre Tecnologia VLM.

Veja Todos os Vídeos do GTC On Demand.

Implantar Agentes de IA do Edge à Cloud

Aproveite a potência do blueprint NVIDIA VSS para implementar agentes de IA com perfeição do edge ao cloud, com desempenho escalável em uma ampla variedade de GPUs. O suporte ao VSS para o NVIDIA DGX Spark estará disponível em breve.

GPUs NVIDIA RTX PRO 6000 Série Blackwell

As GPUs da série NVIDIA RTX PRO 6000 Blackwell aceleram a IA física ao executar todas as cargas de trabalho de desenvolvimento de robôs em treinamento, geração de dados sintéticos, aprendizagem de robôs e simulação.

Saiba Mais

NVIDIA Jetson Thor

Acelere o futuro da IA física e da robótica com os módulos da série NVIDIA Jetson Thor que oferecem até 2070 FP4 TFLOPS de computação de IA e 128GB de memória. Tudo em um formato compacto.

Saiba Mais

NVIDIA DGX Spark

O NVIDIA DGX Spark traz a potência da NVIDIA Grace Blackwell para os desktops de desenvolvedores. O Superchip NVIDIA GB10, combinado com 128GB de memória de sistema unificado, permite que pesquisadores de IA, cientistas de dados e estudantes trabalhem localmente com modelos de IA com até 200 bilhões de parâmetros.

Saiba Mais

Histórias Relacionadas de Clientes

Mais histórias de clientes

Agentes de IA para Análise de Vídeos com Tecnologia de IA Generativa

Impulsione Uma Nova Onda de Aplicações

O Que É um Agente de IA de Análise de Vídeo?

Simplifique Todas as Operações Industriais

Desenvolva com NVIDIA NIM

Crie Agentes de IA com NVIDIA AI Blueprint

Crie Agentes de Edge com Serviços da Plataforma Jetson

O que é um microsserviço NIM?

Como começo a usar os VLMs e o Blueprint da IA da NVIDIA para pesquisa e resumo de vídeos (VSS)?

Como obtenho créditos para o build.nvidia.com?

Preciso pagar para usar um NIM disponível para download?

Como posso obter suporte técnico ao fazer prototipagem com microsserviços NIM?

Comece Agora

Crie Agentes de IA para Análise de Vídeo

Desenvolvedores em Ação

Crie Agentes de IA para Análise Avançada de Vídeo

Aumente os Pipelines de Visão Computacional com IA Generativa

Crie um Workflow de Vídeo com IA Baseada em Agentes

Crie Aplicações XR Multimodais em Tempo Real

Implantar Agentes de IA do Edge à Cloud

GPUs NVIDIA RTX PRO 6000 Série Blackwell

NVIDIA Jetson Thor

NVIDIA DGX Spark

Histórias Relacionadas de Clientes