Tag

LLM Serving

Large language model inference, serving systems, APIs, and latency optimization resources.

Tagged Resources

United States · Private chip maker

Groq develops LPU inference systems focused on deterministic low-latency serving for large language models.

Submit a resource

Help keep AIChipNav accurate by suggesting AI chip, GPU cloud, benchmark, policy, or semiconductor resources.