Spaces:

jerpint
/

buster-dev

Runtime error

App Files Files Community

jerpint commited on Apr 8, 2023

Commit

6008655

1 Parent(s): 444aa3f

update tests

Browse files

Files changed (3) hide show

buster/apps/gradio_app.py +0 -2
buster/busterbot.py +5 -4
tests/test_chatbot.py +18 -18

buster/apps/gradio_app.py CHANGED Viewed

@@ -56,8 +56,6 @@ def chat(question, history, bot_source):
     cfg = available_configs.get(bot_source)
     buster.update_cfg(cfg)
-    # formatting hack for code blocks to render properly every time
-    # answer = answer.replace("```", "\n```\n")
     response = buster.process_input(question)
     # formatted_sources = source_formatter(sources)

     cfg = available_configs.get(bot_source)
     buster.update_cfg(cfg)
     response = buster.process_input(question)
     # formatted_sources = source_formatter(sources)

buster/busterbot.py CHANGED Viewed

@@ -17,6 +17,7 @@ logging.basicConfig(level=logging.INFO)
 @dataclass(slots=True)
 class Response:
     completion: Completion
     matched_documents: pd.DataFrame | None = None
@@ -177,7 +178,7 @@ class Buster:
             logger.warning("No documents found...")
             completion = Completion(text="No documents found.")
             matched_documents = pd.DataFrame(columns=matched_documents.columns)
-            response = Response(completion=completion, matched_documents=matched_documents)
             return response
         # prepare the prompt
@@ -186,17 +187,17 @@ class Buster:
         logger.info(f"GPT Response:\n{completion.text}")
         # check for relevance
-        relevant = self.check_response_relevance(
             completion_text=completion.text,
             engine=self.cfg.embedding_model,
             unk_embedding=self.unk_embedding,
             unk_threshold=self.cfg.unknown_threshold,
         )
-        if not relevant:
             matched_documents = pd.DataFrame(columns=matched_documents.columns)
             # answer generated was the chatbot saying it doesn't know how to answer
         # uncomment override completion with unknown prompt
         # completion = Completion(text=self.cfg.unknown_prompt)
-        response = Response(completion=completion, matched_documents=matched_documents)
         return response

 @dataclass(slots=True)
 class Response:
     completion: Completion
+    is_relevant: bool
     matched_documents: pd.DataFrame | None = None
             logger.warning("No documents found...")
             completion = Completion(text="No documents found.")
             matched_documents = pd.DataFrame(columns=matched_documents.columns)
+            response = Response(completion=completion, matched_documents=matched_documents, is_relevant=False)
             return response
         # prepare the prompt
         logger.info(f"GPT Response:\n{completion.text}")
         # check for relevance
+        is_relevant = self.check_response_relevance(
             completion_text=completion.text,
             engine=self.cfg.embedding_model,
             unk_embedding=self.unk_embedding,
             unk_threshold=self.cfg.unknown_threshold,
         )
+        if not is_relevant:
             matched_documents = pd.DataFrame(columns=matched_documents.columns)
             # answer generated was the chatbot saying it doesn't know how to answer
         # uncomment override completion with unknown prompt
         # completion = Completion(text=self.cfg.unknown_prompt)
+        response = Response(completion=completion, matched_documents=matched_documents, is_relevant=is_relevant)
         return response

tests/test_chatbot.py CHANGED Viewed

@@ -4,9 +4,8 @@ from pathlib import Path
 import numpy as np
 import pandas as pd
-from buster.busterbot import Buster, BusterConfig
-from buster.completers.base import Completer
-from buster.formatter.base import Response
 from buster.retriever import Retriever
 from buster.utils import get_retriever_from_extension
@@ -26,8 +25,8 @@ class MockCompleter(Completer):
     def complete(self):
         return
-    def generate_response(self, user_input, documents) -> Response:
-        return Response(self.expected_answer)
 class MockRetriever(Retriever):
@@ -93,9 +92,9 @@ def test_chatbot_mock_data(tmp_path, monkeypatch):
     filepath = tmp_path / "not_a_real_file.tar.gz"
     retriever = MockRetriever(filepath)
     buster = Buster(cfg=hf_transformers_cfg, retriever=retriever)
-    answer = buster.process_input("What is a transformer?")
-    assert isinstance(answer, str)
-    assert answer.startswith(gpt_expected_answer)
 def test_chatbot_real_data__chatGPT():
@@ -122,8 +121,8 @@ def test_chatbot_real_data__chatGPT():
     )
     retriever = get_retriever_from_extension(DOCUMENTS_FILE)(DOCUMENTS_FILE)
     buster = Buster(cfg=hf_transformers_cfg, retriever=retriever)
-    answer = buster.process_input("What is a transformer?")
-    assert isinstance(answer, str)
 def test_chatbot_real_data__chatGPT_OOD():
@@ -136,7 +135,7 @@ def test_chatbot_real_data__chatGPT_OOD():
         completer_cfg={
             "name": "ChatGPT",
             "text_before_prompt": (
-                """You are a slack chatbot assistant answering technical questions about huggingface transformers, a library to train transformers in python. """
                 """Make sure to format your answers in Markdown format, including code block and snippets. """
                 """Do not include any links to urls or hyperlinks in your answers. """
                 """If you do not know the answer to a question, or if it is completely irrelevant to the library usage, let the user know you cannot answer. """
@@ -156,9 +155,9 @@ def test_chatbot_real_data__chatGPT_OOD():
     )
     retriever = get_retriever_from_extension(DOCUMENTS_FILE)(DOCUMENTS_FILE)
     buster = Buster(cfg=buster_cfg, retriever=retriever)
-    answer = buster.process_input("What is a good recipe for brocolli soup?")
-    assert isinstance(answer, str)
-    assert buster_cfg.unknown_prompt in answer
 def test_chatbot_real_data__GPT():
@@ -166,13 +165,13 @@ def test_chatbot_real_data__GPT():
         unknown_prompt="This doesn't seem to be related to the huggingface library. I am not sure how to answer.",
         embedding_model="text-embedding-ada-002",
         top_k=3,
-        thresh=0.7,
         max_words=3000,
         response_format="slack",
         completer_cfg={
             "name": "GPT3",
             "text_before_prompt": (
-                """You are a slack chatbot assistant answering technical questions about huggingface transformers, a library to train transformers in python.\n"""
                 """Make sure to format your answers in Markdown format, including code block and snippets.\n"""
                 """Do not include any links to urls or hyperlinks in your answers.\n\n"""
                 """Now answer the following question:\n"""
@@ -190,5 +189,6 @@ def test_chatbot_real_data__GPT():
     )
     retriever = get_retriever_from_extension(DOCUMENTS_FILE)(DOCUMENTS_FILE)
     buster = Buster(cfg=hf_transformers_cfg, retriever=retriever)
-    answer = buster.process_input("What is a transformer?")
-    assert isinstance(answer, str)

 import numpy as np
 import pandas as pd
+from buster.busterbot import Buster, BusterConfig, Response
+from buster.completers.base import Completer, Completion
 from buster.retriever import Retriever
 from buster.utils import get_retriever_from_extension
     def complete(self):
         return
+    def generate_response(self, user_input, system_prompt) -> Completion:
+        return Completion(self.expected_answer)
 class MockRetriever(Retriever):
     filepath = tmp_path / "not_a_real_file.tar.gz"
     retriever = MockRetriever(filepath)
     buster = Buster(cfg=hf_transformers_cfg, retriever=retriever)
+    response = buster.process_input("What is a transformer?")
+    assert isinstance(response.completion.text, str)
+    assert response.completion.text.startswith(gpt_expected_answer)
 def test_chatbot_real_data__chatGPT():
     )
     retriever = get_retriever_from_extension(DOCUMENTS_FILE)(DOCUMENTS_FILE)
     buster = Buster(cfg=hf_transformers_cfg, retriever=retriever)
+    response = buster.process_input("What is a transformer?")
+    assert isinstance(response.completion.text, str)
 def test_chatbot_real_data__chatGPT_OOD():
         completer_cfg={
             "name": "ChatGPT",
             "text_before_prompt": (
+                """You are a chatbot assistant answering technical questions about huggingface transformers, a library to train transformers in python. """
                 """Make sure to format your answers in Markdown format, including code block and snippets. """
                 """Do not include any links to urls or hyperlinks in your answers. """
                 """If you do not know the answer to a question, or if it is completely irrelevant to the library usage, let the user know you cannot answer. """
     )
     retriever = get_retriever_from_extension(DOCUMENTS_FILE)(DOCUMENTS_FILE)
     buster = Buster(cfg=buster_cfg, retriever=retriever)
+    response = buster.process_input("What is a good recipe for brocolli soup?")
+    assert isinstance(response.completion.text, str)
+    assert response.is_relevant is False
 def test_chatbot_real_data__GPT():
         unknown_prompt="This doesn't seem to be related to the huggingface library. I am not sure how to answer.",
         embedding_model="text-embedding-ada-002",
         top_k=3,
+        thresh=0,  # ensures documents aren't empty
         max_words=3000,
         response_format="slack",
         completer_cfg={
             "name": "GPT3",
             "text_before_prompt": (
+                """You are a chatbot assistant answering technical questions about huggingface transformers, a library to train transformers in python.\n"""
                 """Make sure to format your answers in Markdown format, including code block and snippets.\n"""
                 """Do not include any links to urls or hyperlinks in your answers.\n\n"""
                 """Now answer the following question:\n"""
     )
     retriever = get_retriever_from_extension(DOCUMENTS_FILE)(DOCUMENTS_FILE)
     buster = Buster(cfg=hf_transformers_cfg, retriever=retriever)
+    response = buster.process_input("What is a transformer?")
+    assert isinstance(response.completion.text, str)
+    assert response.is_relevant is True