GitHub - nyunAI/Faster-LLM-Survey at A100Exllamav2

Load model

mkdir model && cd model git lfs install git clone https://huggingface.co/meta-llama/Llama-2-7b-hf

Engines

Llama.cpp

bash llamacpp/setup.sh bash llamacpp/generate.sh to generate ggml compiled files for fp16 and q4_0, q4_k_m quantized models bash llamacpp/bench.sh to benchmark the above the

GPTQ via AutoGPTQ

quantized with alpaca. Once can use other dataset versions and corresponding dataset loading implementation.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
datasets		datasets
engine		engine
experiments		experiments
exports/Llama-2-7b-hf/engine/exllamav2		exports/Llama-2-7b-hf/engine/exllamav2
model		model
prune/llmpruner		prune/llmpruner
quant		quant
.gitignore		.gitignore
.gitmodules		.gitmodules
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Load model

Engines

Llama.cpp

GPTQ via AutoGPTQ

About

Releases

Packages

Languages

nyunAI/Faster-LLM-Survey

Folders and files

Latest commit

History

Repository files navigation

Load model

Engines

Llama.cpp

GPTQ via AutoGPTQ

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages