8000 CUDA: skip fully masked-out KV in FA vec kernel by JohannesGaessler · Pull Request #13584 · ggml-org/llama.cpp · GitHub

CUDA: skip fully masked-out KV in FA vec kernel#13584

Merged

JohannesGaessler merged 2 commits intoggml-org:masterfrom

JohannesGaessler:cuda-fa-opt-8

May 20, 2025

Commits on May 15, 2025

CUDA: skip fully masked-out KV in FA vec kernel
JohannesGaessler
committed

Commits on May 16, 2025

fix AMD compilation
JohannesGaessler
committed

0