8000 CUDA: faster Deepseek FA, add Turing support by JohannesGaessler · Pull Request #13435 · ggml-org/llama.cpp · GitHub

CUDA: faster Deepseek FA, add Turing support#13435

Merged

JohannesGaessler merged 1 commit intoggml-org:masterfrom

JohannesGaessler:cuda-fa-opt-2

May 14, 2025

Commits on May 10, 2025

CUDA: faster Deepseek FA, add Turing support
JohannesGaessler
committed

0