Embedding Improvement

1. move embedding function into llm_utils 2. add try feature with in embedding function
2026-04-30 03:00:41 -04:00 · 2023-04-16 00:13:29 +08:00
parent 5e18bb4b61
commit f67b81e200
4 changed files with 44 additions and 10 deletions
--- a/autogpt/memory/local.py
+++ b/autogpt/memory/local.py
@@ -5,7 +5,8 @@ from typing import Any, List, Optional, Tuple
 import numpy as np
 import orjson

-from autogpt.memory.base import MemoryProviderSingleton, get_ada_embedding
+from autogpt.memory.base import MemoryProviderSingleton
+from autogpt.llm_utils import create_embedding_with_ada

 EMBED_DIM = 1536
 SAVE_OPTIONS = orjson.OPT_SERIALIZE_NUMPY | orjson.OPT_SERIALIZE_DATACLASS
@@ -70,7 +71,7 @@ class LocalCache(MemoryProviderSingleton):
            return ""
        self.data.texts.append(text)

-        embedding = get_ada_embedding(text)
+        embedding = create_embedding_with_ada(text)

        vector = np.array(embedding).astype(np.float32)
        vector = vector[np.newaxis, :]
@@ -118,7 +119,7 @@ class LocalCache(MemoryProviderSingleton):

        Returns: List[str]
        """
-        embedding = get_ada_embedding(text)
+        embedding = create_embedding_with_ada(text)

        scores = np.dot(self.data.embeddings, embedding)

--- a/autogpt/memory/pinecone.py
+++ b/autogpt/memory/pinecone.py
@@ -2,8 +2,8 @@ import pinecone
 from colorama import Fore, Style

 from autogpt.logs import logger
-from autogpt.memory.base import MemoryProviderSingleton, get_ada_embedding
-
+from autogpt.memory.base import MemoryProviderSingleton
+from autogpt.llm_utils import create_embedding_with_ada

 class PineconeMemory(MemoryProviderSingleton):
    def __init__(self, cfg):
@@ -43,7 +43,7 @@ class PineconeMemory(MemoryProviderSingleton):
        self.index = pinecone.Index(table_name)

    def add(self, data):
-        vector = get_ada_embedding(data)
+        vector = create_embedding_with_ada(data)
        # no metadata here. We may wish to change that long term.
        self.index.upsert([(str(self.vec_num), vector, {"raw_text": data})])
        _text = f"Inserting data into memory at index: {self.vec_num}:\n data: {data}"
@@ -63,7 +63,7 @@ class PineconeMemory(MemoryProviderSingleton):
        :param data: The data to compare to.
        :param num_relevant: The number of relevant data to return. Defaults to 5
        """
-        query_embedding = get_ada_embedding(data)
+        query_embedding = create_embedding_with_ada(data)
        results = self.index.query(
            query_embedding, top_k=num_relevant, include_metadata=True
        )
--- a/autogpt/memory/redismem.py
+++ b/autogpt/memory/redismem.py
@@ -9,7 +9,8 @@ from redis.commands.search.indexDefinition import IndexDefinition, IndexType
 from redis.commands.search.query import Query

 from autogpt.logs import logger
-from autogpt.memory.base import MemoryProviderSingleton, get_ada_embedding
+from autogpt.memory.base import MemoryProviderSingleton
+from autogpt.llm_utils import create_embedding_with_ada

 SCHEMA = [
    TextField("data"),
@@ -85,7 +86,7 @@ class RedisMemory(MemoryProviderSingleton):
        """
        if "Command Error:" in data:
            return ""
-        vector = get_ada_embedding(data)
+        vector = create_embedding_with_ada(data)
        vector = np.array(vector).astype(np.float32).tobytes()
        data_dict = {b"data": data, "embedding": vector}
        pipe = self.redis.pipeline()
@@ -127,7 +128,7 @@ class RedisMemory(MemoryProviderSingleton):

        Returns: A list of the most relevant data.
        """
-        query_embedding = get_ada_embedding(data)
+        query_embedding = create_embedding_with_ada(data)
        base_query = f"*=>[KNN {num_relevant} @embedding $vector AS vector_score]"
        query = (
            Query(base_query)