Bugfix: enable embeddings for fastapi server

abetlen · abetlen · commit f28bf3f13d4f · 2023-04-01T15:12:25.000-04:00
diff --git a/examples/fastapi_server.py b/examples/fastapi_server.py
@@ -31,6 +31,7 @@ class Settings(BaseSettings):
     settings.model,
     f16_kv=True,
     use_mlock=True,
+    embedding=True,
     n_threads=6,
     n_batch=2048,
 )
@@ -93,4 +94,6 @@ class Config:
     response_model=CreateEmbeddingResponse,
 )
 def create_embedding(request: CreateEmbeddingRequest):
-    return llama.create_embedding(**request.dict())
+    # print(request)
+    # return llama.create_embedding(**request.dict(exclude={"model", "user"}))
+    return llama.create_embedding(request.input)