8000 Q8: use int8_t, AVX/AVX2 optimizations by sw · Pull Request #972 · ggml-org/llama.cpp · GitHub

Q8: use int8_t, AVX/AVX2 optimizations#972

Merged

ggerganov merged 2 commits intoggml-org:q8_0from

Apr 14, 2023

Commits on Apr 14, 2023

0