Gregory-Pereira

Follow

🚀

keeping everything running

Greg Pereira Gregory-Pereira

🚀

keeping everything running

Follow

Sr. Machine Learning Engineer @ Red Hat | Inference Engineering | Building llm-d: distributed inference for LLMs on Kubernetes

54 followers · 24 following

@RedHatOfficial @llm-d
San Francisco
22:28 (UTC -07:00)
in/gregpereira1

Achievements

Achievements

Organizations

Pinned Loading

llm-d/llm-d llm-d/llm-d Public

Achieve state of the art inference performance with modern accelerators on Kubernetes

Shell 3.6k 569
kubernetes-sigs/gateway-api-inference-extension kubernetes-sigs/gateway-api-inference-extension Public

Gateway API Inference Extension

Go 701 293
vllm-project/vllm vllm-project/vllm Public

A high-throughput and memory-efficient inference and serving engine for LLMs

Python 85k 18.7k
deepseek-ai/DeepEP deepseek-ai/DeepEP Public

DeepEP: an efficient expert-parallel communication library

Cuda 9.8k 1.3k
llm-d/llm-d-latency-predictor llm-d/llm-d-latency-predictor Public

Latency prediction service for ML-model based scoring with llm-d-inference-scheduler

Python 6 14
llm-d-router llm-d-router Public

Forked from llm-d/llm-d-router

Inference scheduler for llm-d

Go 1