server : fix LRU check #14079

ggerganov · 2025-06-09T06:40:08Z

When slot.t_last_used == t_last the deferred tasks got stuck in the deferred queue.

ggml-ci

server : fix LRU check

6ae47cb

ggml-ci

ggerganov requested a review from ngxson as a code owner June 9, 2025 06:40

github-actions bot added examples server labels Jun 9, 2025

ggerganov mentioned this pull request Jun 9, 2025

Eval bug: processing server tasks via REST API seems to freeze, with no response sent back to the calling application #14073

Closed

hajaulee approved these changes Jun 9, 2025

View reviewed changes

ggerganov merged commit 87d34b3 into master Jun 9, 2025
54 checks passed

ggerganov deleted the gg/server-fix-lru branch June 9, 2025 09:58

Lalalili1122 added a commit to Lalalili1122/llama.cpp that referenced this pull request Jun 9, 2025

update PR ggml-org#14079 of main branch

701a64d

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

server : fix LRU check #14079

server : fix LRU check #14079

Uh oh!

Uh oh!

Uh oh!

Uh oh!

server : fix LRU check #14079

server : fix LRU check #14079

Uh oh!

Conversation

Uh oh!

Uh oh!

Uh oh!