Add standard call to LiteLLM engine

2024-12-24 19:55:34 +01:00 · 2024-12-24 19:55:34 +01:00 · 162d4dc362
parent 1e357cee7f
commit 162d4dc362
2 changed files with 30 additions and 7 deletions
--- a/examples/tool_calling_agent_from_any_llm.py
+++ b/examples/tool_calling_agent_from_any_llm.py
@ -6,7 +6,7 @@ from smolagents import tool, HfApiEngine, OpenAIEngine, AnthropicEngine, Transfo
 # llm_engine = AnthropicEngine("claude-3-5-sonnet-20240620")
 # llm_engine = HfApiEngine("meta-llama/Llama-3.3-70B-Instruct")
 # llm_engine = TransformersEngine("meta-llama/Llama-3.2-2B-Instruct")
-llm_engine = LiteLLMEngine()
+llm_engine = LiteLLMEngine("gpt-4o")

@tool
 def get_weather(location: str) -> str:
--- a/src/smolagents/llm_engines.py
+++ b/src/smolagents/llm_engines.py
@ -19,6 +19,7 @@ from enum import Enum
 from typing import Dict, List, Optional, Tuple
 from transformers import AutoTokenizer, AutoModelForCausalLM, StoppingCriteria, StoppingCriteriaList

+import litellm
 import logging
 import os
 import random
@ -566,11 +567,32 @@ class AnthropicEngine:
 class LiteLLMEngine():
    def __init__(self, model_id="anthropic/claude-3-5-sonnet-20240620"):
        self.model_id = model_id
-        import os, litellm
-
        # IMPORTANT - Set this to TRUE to add the function to the prompt for Non OpenAI LLMs
        litellm.add_function_to_prompt = True
-    
+        self.last_input_token_count = 0
+        self.last_output_token_count = 0
+
+    def __call__(
+        self,
+        messages: List[Dict[str, str]],
+        stop_sequences: Optional[List[str]] = None,
+        grammar: Optional[str] = None,
+        max_tokens: int = 1500,
+    ) -> str:
+        messages = get_clean_message_list(
+            messages, role_conversions=tool_role_conversions
+        )
+
+        response = litellm.completion(
+            model=self.model_id,
+            messages=messages,
+            stop=stop_sequences,
+            max_tokens=max_tokens,
+        )
+        self.last_input_token_count = response.usage.prompt_tokens
+        self.last_output_token_count = response.usage.completion_tokens
+        return response.choices[0].message.content
+
    def get_tool_call(
            self,
            messages: List[Dict[str, str]],
@ -578,19 +600,20 @@ class LiteLLMEngine():
            stop_sequences: Optional[List[str]] = None,
            max_tokens: int = 1500,
        ):
-        from litellm import completion
        messages = get_clean_message_list(
            messages, role_conversions=tool_role_conversions
        )
-        response = completion(
+        response = litellm.completion(
            model=self.model_id,
            messages=messages,
            tools=[get_json_schema(tool) for tool in available_tools],
            tool_choice="required",
-            max_tokens=max_tokens,
            stop=stop_sequences,
+            max_tokens=max_tokens,
        )
        tool_calls = response.choices[0].message.tool_calls[0]
+        self.last_input_token_count = response.usage.prompt_tokens
+        self.last_output_token_count = response.usage.completion_tokens
        return tool_calls.function.name, tool_calls.function.arguments, tool_calls.id