Add warning message about do_sample to alert BC (InternLM#2654)

lvhan028 · web-flow · commit c25520a8e1ea · 2024-10-25T15:24:07.000+08:00
* add warning message for do_sample

* update

* update
diff --git a/lmdeploy/api.py b/lmdeploy/api.py
@@ -11,7 +11,7 @@ def pipeline(model_path: str,
              backend_config: Optional[Union[TurbomindEngineConfig,
                                             PytorchEngineConfig]] = None,
              chat_template_config: Optional[ChatTemplateConfig] = None,
-             log_level: str = 'ERROR',
+             log_level: str = 'WARNING',
              max_log_len: int = None,
              **kwargs):
     """
diff --git a/lmdeploy/serve/async_engine.py b/lmdeploy/serve/async_engine.py
@@ -501,6 +501,12 @@ async def generate(
         if gen_config.stop_token_ids is None:
             gen_config.stop_token_ids = self.stop_words
         if not gen_config.do_sample:
+            logger.warn(f'GenerationConfig: {gen_config}')
+            logger.warn(
+                'Since v0.6.0, lmdeploy add `do_sample` in '
+                'GenerationConfig. It defaults to False, meaning greedy '
+                'decoding. Please set `do_sample=True` if sampling '
+                ' decoding is needed')
             # greedy decode
             gen_config.top_k = 1
             # avoid unnecessary process