Fix tokenizer fallback to use o200k_base instead of cl100k_base

2025-07-21 04:50:39 +08:00 · 2025-04-14 21:15:19 +03:00
parent 4b58a5488f
commit 08bf9593b2
1 changed files with 5 additions and 2 deletions
--- a/pr_agent/algo/token_handler.py
+++ b/pr_agent/algo/token_handler.py
@ -19,8 +19,11 @@ class TokenEncoder:
            with cls._lock:  # Lock acquisition to ensure thread safety
                if cls._encoder_instance is None or model != cls._model:
                    cls._model = model
-                    cls._encoder_instance = encoding_for_model(cls._model) if "gpt" in cls._model else get_encoding(
-                        "cl100k_base")
+                    try:
+                        cls._encoder_instance = encoding_for_model(cls._model) if "gpt" in cls._model else get_encoding(
+                            "o200k_base")
+                    except:
+                        cls._encoder_instance = get_encoding("o200k_base")
        return cls._encoder_instance