TrinityXI

Follow

💭

I may be slow to respond.

TrinityXI

💭

I may be slow to respond.

Follow

Achievements

Achievements

Pinned Loading

Fast-llm Fast-llm Public

Forked from ztxz16/fastllm

fastllm是c++实现，后端无依赖（仅依赖CUDA，无需依赖PyTorch）的高性能大模型推理库。可实现单4090推理DeepSeek R1 671B INT4模型，单路可达20+tps。

C++