Spaces:

Alejo760
/

heraudio

Sleeping

App Files Files Community

Alejo760 commited on Nov 17, 2024

Commit

a7d5358

verified ·

1 Parent(s): d962ac1

Update app.py

Browse files

Files changed (1) hide show

app.py +98 -55

app.py CHANGED Viewed

@@ -1,8 +1,6 @@
 import gradio as gr
 import os
 import fitz  # PyMuPDF
-import threading
-import time
 from groq import Groq
 from langchain_groq import ChatGroq
@@ -15,15 +13,17 @@ model_name = "llama-3.1-70b-versatile"
 chat_groq = ChatGroq(model=model_name)
 def transcribe_audio(audio):
     transcription_text = ""
     try:
-        with open(audio, "rb") as file:
             transcription = client.audio.transcriptions.create(
                 file=file,
                 model="whisper-large-v3",
                 response_format="json",
                 temperature=0.0
             )
         transcription_text = transcription.text
     except Exception as e:
         print(f"Error en transcripción de audio: {e}")
@@ -61,7 +61,7 @@ def organize_clinical_record(current_text, transcription_text, pdf_text):
     ** Medicamentos:
     AYUDAS DIAGNOSTICAS:
- (ordenar todas las ayudas diagnósticas por fecha de forma que sea simple y sencillo leer los resultados para el médico, cuando se requiera presenta los resultados en miles, asegurate que no te falte ninguna ayuda, y no interpretes, solo pon los valores sin rango de normalidad en prosa
     separa cada examen con una coma, usa minusculas y organiza por fechas.
  por ejemplo:
 11/10/2024: resultado 1 , resultado 2, ...
@@ -89,8 +89,10 @@ def organize_clinical_record(current_text, transcription_text, pdf_text):
     organized_text = chat_groq.invoke(prompt)
     return organized_text
-# Variable global para almacenar el texto iterativo
-iterative_text = """
 MOTIVO DE CONSULTA:
 ENFERMEDAD ACTUAL:
@@ -113,39 +115,66 @@ ANTECEDENTES:
 AYUDAS DIAGNOSTICAS:
 """
-# Función para procesar el audio cada minuto
-def continuous_audio_processing():
-    global iterative_text
-    while True:
-        if audio_input.value:
-            audio_data = audio_input.value
-            transcription_text = transcribe_audio(audio_data)
-            iterative_text = organize_clinical_record(iterative_text, transcription_text, "")
-            # Actualizar el campo de texto en la interfaz
-            iterative_output.value = iterative_text
-            # Limpiar el audio
-            audio_input.clear()
-        time.sleep(60)  # Esperar un minuto antes de la próxima transcripción
-# Función para procesar el PDF inmediatamente después de subirlo
-def on_pdf_upload(pdfs):
-    global iterative_text
     debug_info = ""
     if pdfs:
-        pdf_text_combined = ""
         for pdf in pdfs:
-            pdf_content = extract_text_from_pdf(pdf.name)
-            pdf_text_combined += pdf_content + "\n"
-            debug_info += f"Procesado PDF: {pdf.name}\n"
-        iterative_text = organize_clinical_record(iterative_text, "", pdf_text_combined)
-        # Actualizar el campo de texto en la interfaz
-        iterative_output.value = iterative_text
     else:
         debug_info += "No se proporcionaron PDFs.\n"
-    # Mostrar información de depuración
-    debug_output.value = debug_info
-    # Limpiar los PDFs subidos
-    pdf_files.clear()
 theme = gr.themes.Base(
     primary_hue=gr.themes.Color(
@@ -160,36 +189,50 @@ theme = gr.themes.Base(
 with gr.Blocks(theme=theme) as iface:
     gr.Markdown("# Aplicación de Procesamiento de Audio y PDFs")
     # Campo de texto para mostrar y editar el registro clínico
     iterative_output = gr.Textbox(
         label="Registro Clínico Organizado",
-        value=iterative_text,
-        lines=20,
-    )
-    # Botón para iniciar la grabación de audio
-    start_audio_button = gr.Button("Iniciar Grabación de Audio")
-    # Componente de audio oculto para grabación continua
-    audio_input = gr.Audio(sources="microphone", type="filepath", streaming=True, label="Grabación de Audio Continua")
-    # Campo para subir PDFs que procesa automáticamente al subir
-    pdf_files = gr.File(file_types=[".pdf"], label="Subir PDFs", file_count="multiple", type="filepath")
     debug_output = gr.Textbox(label="Información de Depuración", lines=10)
-    # Evento para iniciar la grabación continua al hacer clic en el botón
-    def start_recording():
-        # Iniciar el hilo de procesamiento continuo de audio
-        threading.Thread(target=continuous_audio_processing, daemon=True).start()
-        # Desactivar el botón para evitar múltiples hilos
-        start_audio_button.visible = False
-        start_audio_button.update(visible=False)
-    start_audio_button.click(fn=start_recording)
-    # Evento para procesar PDFs al subirlos
-    pdf_files.upload(fn=on_pdf_upload, inputs=pdf_files)
 iface.launch(auth=[("her", "her")])

 import gradio as gr
 import os
 import fitz  # PyMuPDF
 from groq import Groq
 from langchain_groq import ChatGroq
 chat_groq = ChatGroq(model=model_name)
 def transcribe_audio(audio):
+    filename = audio
     transcription_text = ""
     try:
+        with open(filename, "rb") as file:
             transcription = client.audio.transcriptions.create(
                 file=file,
                 model="whisper-large-v3",
                 response_format="json",
                 temperature=0.0
             )
+        # Acceder al atributo 'text' directamente
         transcription_text = transcription.text
     except Exception as e:
         print(f"Error en transcripción de audio: {e}")
     ** Medicamentos:
     AYUDAS DIAGNOSTICAS:
+ (ordenar todas las ayudas diagnósticas por fecha de forma que sea simple y sencillo leer los resultados para el médico,cuando se requiera presenta los resultados en miles, asegurate que no te falte ninguna ayuda, y no interpretes, solo pon los valores sin rango de normalidad en prosa
     separa cada examen con una coma, usa minusculas y organiza por fechas.
  por ejemplo:
 11/10/2024: resultado 1 , resultado 2, ...
     organized_text = chat_groq.invoke(prompt)
     return organized_text
+def process_input(audio, pdfs, current_text):
+    # Si no hay texto actual, utilizamos el texto inicial proporcionado
+    if not current_text.strip():
+        current_text = """
 MOTIVO DE CONSULTA:
 ENFERMEDAD ACTUAL:
 AYUDAS DIAGNOSTICAS:
 """
+    transcription_text = transcribe_audio(audio) if audio else ""
     debug_info = ""
+    # Definimos el límite máximo de palabras
+    max_words_per_prompt = 4500
+    # Preparamos la lista de textos de PDFs
+    pdf_texts = []
     if pdfs:
         for pdf in pdfs:
+            pdf_content = extract_text_from_pdf(pdf)
+            pdf_texts.append((os.path.basename(pdf), pdf_content))
+            debug_info += f"Leído PDF: {pdf}\n"
     else:
         debug_info += "No se proporcionaron PDFs.\n"
+    # Combinamos los textos y contamos las palabras
+    updated_text = current_text
+    combined_texts = []
+    total_words = len(updated_text.split()) + len(transcription_text.split())
+    for pdf_name, pdf_content in pdf_texts:
+        pdf_words = len(pdf_content.split())
+        if total_words + pdf_words > max_words_per_prompt:
+            # Procesamos los textos actuales
+            pdf_text_combined = "\n".join([f"Contenido del PDF ({name}):\n{content}" for name, content in combined_texts])
+            updated_text = organize_clinical_record(updated_text, transcription_text, pdf_text_combined)
+            debug_info += f"Procesado lote de PDFs: {[name for name, _ in combined_texts]}\n"
+            # Reiniciamos los textos
+            combined_texts = [(pdf_name, pdf_content)]
+            total_words = len(updated_text.split()) + len(transcription_text.split()) + pdf_words
+        else:
+            combined_texts.append((pdf_name, pdf_content))
+            total_words += pdf_words
+    # Procesamos el último lote si hay PDFs pendientes
+    if combined_texts:
+        pdf_text_combined = "\n".join([f"Contenido del PDF ({name}):\n{content}" for name, content in combined_texts])
+        updated_text = organize_clinical_record(updated_text, transcription_text, pdf_text_combined)
+        debug_info += f"Procesado lote de PDFs: {[name for name, _ in combined_texts]}\n"
+    debug_info += f"Transcripción de Audio: {transcription_text}\n"
+    # Eliminar archivo de audio
+    if audio and os.path.exists(audio):
+        try:
+            os.remove(audio)
+        except Exception as e:
+            debug_info += f"Error al eliminar archivo de audio: {e}\n"
+    # Eliminar archivos PDF
+    if pdfs:
+        for pdf in pdfs:
+            if os.path.exists(pdf):
+                try:
+                    os.remove(pdf)
+                except Exception as e:
+                    debug_info += f"Error al eliminar PDF {pdf}: {e}\n"
+    return updated_text, debug_info
 theme = gr.themes.Base(
     primary_hue=gr.themes.Color(
 with gr.Blocks(theme=theme) as iface:
     gr.Markdown("# Aplicación de Procesamiento de Audio y PDFs")
     # Campo de texto para mostrar y editar el registro clínico
     iterative_output = gr.Textbox(
         label="Registro Clínico Organizado",
+        value="""
+MOTIVO DE CONSULTA:
+ENFERMEDAD ACTUAL:
+REVISIÓN POR SISTEMAS:
+ANTECEDENTES:
+**Patológicos:
+** Alérgicos:
+** Tóxicos:
+** Familiares:
+** Transfusionales:
+** Traumáticos:
+** Ginecológicos:
+** Quirúrgicos:
+** Estado de vacunación:
+** Hospitalizaciones previas:
+** Medicamentos:
+AYUDAS DIAGNOSTICAS:
+""",
+        lines=20,
+    )
+    audio_input = gr.Audio(sources=["microphone"], type="filepath", label="Entrada de Audio")
+    pdf_files = gr.File(file_types=[".pdf"], label="Subir PDFs (puedes subir múltiples archivos)", file_count="multiple", type="filepath")
+    process_button = gr.Button("Iniciar Procesamiento")
     debug_output = gr.Textbox(label="Información de Depuración", lines=10)
+    # Función para manejar el clic del botón y actualizar el texto
+    def on_process_click(audio, pdfs, current_text):
+        updated_text, debug_info = process_input(audio, pdfs, current_text)
+        # Devolver None para resetear audio_input y pdf_files
+        return updated_text, debug_info, None, None
+    process_button.click(
+        fn=on_process_click,
+        inputs=[audio_input, pdf_files, iterative_output],
+        outputs=[iterative_output, debug_output, audio_input, pdf_files]
+    )
 iface.launch(auth=[("her", "her")])