Spaces:

farmax
/

MD2JSON

Sleeping

App Files Files Community

farmax commited on 10 days ago

Commit

80ec853

verified ·

1 Parent(s): b36e5d1

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -15

app.py CHANGED Viewed

@@ -1,19 +1,19 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline
 # Modelli
 MODEL_DEBERTA = "osiria/deberta-italian-question-answering"
-MODEL_UMBERTO = "Musixmatch/umberto-commoncrawl-cased-v1"
 # Pipeline DeBERTa (estrattivo)
 tok_deb = AutoTokenizer.from_pretrained(MODEL_DEBERTA)
 mdl_deb = AutoModelForQuestionAnswering.from_pretrained(MODEL_DEBERTA)
 qa_deb = pipeline("question-answering", model=mdl_deb, tokenizer=tok_deb, device=-1)
-# Pipeline UmBERTo (estrattivo)
-tok_umb = AutoTokenizer.from_pretrained(MODEL_UMBERTO)
-mdl_umb = AutoModelForQuestionAnswering.from_pretrained(MODEL_UMBERTO)
-qa_umb = pipeline("question-answering", model=mdl_umb, tokenizer=tok_umb, device=-1)
 def ensemble_invoice_qa(md_text: str, question: str):
     results = {}
@@ -28,22 +28,22 @@ def ensemble_invoice_qa(md_text: str, question: str):
     except Exception as e:
         results["DeBERTa (estrattivo)"] = {"errore": str(e)}
-    # Estrattivo (UmBERTo)
     try:
-        res_umb = qa_umb(question=question, context=md_text)
-        results["UmBERTo (estrattivo)"] = {
-            "risposta": res_umb["answer"].strip(),
-            "confidenza": round(res_umb["score"], 3)
         }
     except Exception as e:
-        results["UmBERTo (estrattivo)"] = {"errore": str(e)}
     return results
 # ================== UI Gradio ==================
 with gr.Blocks(theme=gr.themes.Base()) as demo:
-    gr.Markdown("# 🧾 Invoice QA: Ensemble DeBERTa + UmBERTo")
-    gr.Markdown("Confronto tra risposte estrattive di due modelli italiani.")
     with gr.Row():
         with gr.Column(scale=1):
@@ -61,7 +61,7 @@ with gr.Blocks(theme=gr.themes.Base()) as demo:
             btn = gr.Button("🔍 Analizza Documento", variant="primary")
         with gr.Column(scale=1):
-            out_json = gr.JSON(label="Risultati Ensemble (DeBERTa vs UmBERTo)")
     btn.click(
         fn=ensemble_invoice_qa,

 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForQuestionAnswering, AutoModelForCausalLM, pipeline
 # Modelli
 MODEL_DEBERTA = "osiria/deberta-italian-question-answering"
+MODEL_GEPPETTO = "LorenzoDeMattei/GePpeTto"
 # Pipeline DeBERTa (estrattivo)
 tok_deb = AutoTokenizer.from_pretrained(MODEL_DEBERTA)
 mdl_deb = AutoModelForQuestionAnswering.from_pretrained(MODEL_DEBERTA)
 qa_deb = pipeline("question-answering", model=mdl_deb, tokenizer=tok_deb, device=-1)
+# Pipeline GePpeTto (generativo)
+tok_gepp = AutoTokenizer.from_pretrained(MODEL_GEPPETTO)
+mdl_gepp = AutoModelForCausalLM.from_pretrained(MODEL_GEPPETTO)
+qa_gepp = pipeline("text-generation", model=mdl_gepp, tokenizer=tok_gepp, device=-1)
 def ensemble_invoice_qa(md_text: str, question: str):
     results = {}
     except Exception as e:
         results["DeBERTa (estrattivo)"] = {"errore": str(e)}
+    # Generativo (GePpeTto)
     try:
+        prompt = f"Domanda: {question}\nContesto: {md_text}\nRisposta:"
+        res_gepp = qa_gepp(prompt, max_new_tokens=64, do_sample=False)
+        results["GePpeTto (generativo)"] = {
+            "risposta": res_gepp[0]["generated_text"].replace(prompt, "").strip()
         }
     except Exception as e:
+        results["GePpeTto (generativo)"] = {"errore": str(e)}
     return results
 # ================== UI Gradio ==================
 with gr.Blocks(theme=gr.themes.Base()) as demo:
+    gr.Markdown("# 🧾 Invoice QA: Ensemble DeBERTa + GePpeTto")
+    gr.Markdown("Confronto tra risposte estrattive (DeBERTa) e generative (GePpeTto).")
     with gr.Row():
         with gr.Column(scale=1):
             btn = gr.Button("🔍 Analizza Documento", variant="primary")
         with gr.Column(scale=1):
+            out_json = gr.JSON(label="Risultati Ensemble (Estrattivo vs Generativo)")
     btn.click(
         fn=ensemble_invoice_qa,