Spaces:

Alejo760
/

heraudio

Sleeping

App Files Files Community

Alejo760 commited on Nov 17, 2024

Commit

19e6757

verified ·

1 Parent(s): 99fdb26

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -14

app.py CHANGED Viewed

@@ -48,16 +48,21 @@ def extract_texts_from_pdfs(pdfs):
         text += pdf_text + "\n"
     return text
 def organize_clinical_record(current_text, transcription_text, pdf_text):
     clinical_record_template = """
     MOTIVO DE CONSULTA: usa una frase en palabras del paciente entre comillas
     ENFERMEDAD ACTUAL:
     (usa terminologia médica En orden cronológico desde el inicio de los síntomas, no incluir la edad ni los antecedentes en esta sección, evolución de los síntomas, factores desencadenantes, hitos de la enfermedad del paciente, finaliza como se siente hoy)
     REVISIÓN POR SISTEMAS:
     (usa terminologia médica)
     ANTECEDENTES:
     **Patológicos: (describir en lenguaje tecnico medico la enfermedad con clasificación y complicaciones relacionadas de cada antecedente )
     ** Alérgicos: (con tipo de reacción y a cuál medicamento)
@@ -70,25 +75,19 @@ def organize_clinical_record(current_text, transcription_text, pdf_text):
     ** Estado de vacunación:
     ** Hospitalizaciones previas (fecha y descripción breve )
     ** Medicamentos:
     AYUDAS DIAGNOSTICAS:
- (ordenar todas las ayudas diagnósticas por fecha de forma que sea simple y sencillo leer los resultados para el médico, cuando se requiera presenta los resultados en miles, asegurate que no te falte ninguna ayuda, y no interpretes, solo pon los valores sin rango de normalidad en prosa separa cada examen con una coma, usa minusculas y organiza por fechas. Por ejemplo: 11/10/2024: resultado 1 , resultado 2, ... 12/11/2023: resultado 1 , resultado 2, ... )
     """
     prompt = f"""
     Toma el siguiente borrador del registro clínico y actualízalo con la nueva información proporcionada, siguiendo la estructura dada:
     Estructura del Registro Clínico:
     {clinical_record_template}
     Borrador Actual del Registro Clínico:
     {current_text}
     Nueva Información de Audio:
     {transcription_text}
     Nueva Información del PDF:
     {pdf_text}
     Actualiza el borrador incorporando la nueva información en las secciones correspondientes, sin eliminar información previa que aún sea relevante.
     """
     try:
@@ -96,7 +95,7 @@ def organize_clinical_record(current_text, transcription_text, pdf_text):
         return organized_text
     except Exception as e:
         print(f"Error al invocar ChatGroq: {e}")
-        return current_text  # Devuelve el texto actual si falla
 def process_input(audio, pdfs, current_text):
     try:
@@ -109,8 +108,33 @@ def process_input(audio, pdfs, current_text):
     except Exception as e:
         pdf_text = ""
         print(f"Error en extracción de PDFs: {e}")
-    organized_record = organize_clinical_record(current_text, transcription_text, pdf_text)
-    return organized_record.content, "Información de depuración"
 # Configuración del tema
 theme = gr.themes.Base(
@@ -159,7 +183,7 @@ with gr.Blocks(theme=theme) as iface:
     )
     current_state = gr.State(value=initial_text)
     audio_filepath = gr.Audio(sources=["microphone"], type="filepath", label="Entrada de Audio")
-    pdf_files = gr.File(file_types=[".pdf"], label="Subir PDF", file_count="simple")
     debug_output = gr.Textbox(label="Información de Depuración", lines=10)
     # Función para capturar cambios en el iterative_output

         text += pdf_text + "\n"
     return text
+def split_text_into_chunks(text, max_words_per_chunk):
+    words = text.split()
+    chunks = []
+    for i in range(0, len(words), max_words_per_chunk):
+        chunk = ' '.join(words[i:i + max_words_per_chunk])
+        chunks.append(chunk)
+    return chunks
 def organize_clinical_record(current_text, transcription_text, pdf_text):
     clinical_record_template = """
     MOTIVO DE CONSULTA: usa una frase en palabras del paciente entre comillas
     ENFERMEDAD ACTUAL:
     (usa terminologia médica En orden cronológico desde el inicio de los síntomas, no incluir la edad ni los antecedentes en esta sección, evolución de los síntomas, factores desencadenantes, hitos de la enfermedad del paciente, finaliza como se siente hoy)
     REVISIÓN POR SISTEMAS:
     (usa terminologia médica)
     ANTECEDENTES:
     **Patológicos: (describir en lenguaje tecnico medico la enfermedad con clasificación y complicaciones relacionadas de cada antecedente )
     ** Alérgicos: (con tipo de reacción y a cuál medicamento)
     ** Estado de vacunación:
     ** Hospitalizaciones previas (fecha y descripción breve )
     ** Medicamentos:
     AYUDAS DIAGNOSTICAS:
+    (ordenar todas las ayudas diagnósticas por fecha de forma que sea simple y sencillo leer los resultados para el médico, cuando se requiera presenta los resultados en miles, asegurate que no te falte ninguna ayuda, y no interpretes, solo pon los valores sin rango de normalidad en prosa separa cada examen con una coma, usa minusculas y organiza por fechas. Por ejemplo: 11/10/2024: resultado 1 , resultado 2, ... 12/11/2023: resultado 1 , resultado 2, ... )
     """
     prompt = f"""
     Toma el siguiente borrador del registro clínico y actualízalo con la nueva información proporcionada, siguiendo la estructura dada:
     Estructura del Registro Clínico:
     {clinical_record_template}
     Borrador Actual del Registro Clínico:
     {current_text}
     Nueva Información de Audio:
     {transcription_text}
     Nueva Información del PDF:
     {pdf_text}
     Actualiza el borrador incorporando la nueva información en las secciones correspondientes, sin eliminar información previa que aún sea relevante.
     """
     try:
         return organized_text
     except Exception as e:
         print(f"Error al invocar ChatGroq: {e}")
+        return current_text  # Return the current text if the API call fails
 def process_input(audio, pdfs, current_text):
     try:
     except Exception as e:
         pdf_text = ""
         print(f"Error en extracción de PDFs: {e}")
+    # Now process the transcription_text and pdf_text in batches
+    updated_text = current_text
+    # Define the maximum words per chunk (adjust as needed)
+    max_chunk_words = 1000  # Adjust this number based on your API limits
+    for text_label, text_content in [("Audio", transcription_text), ("PDF", pdf_text)]:
+        if not text_content:
+            continue
+        text_chunks = split_text_into_chunks(text_content, max_chunk_words)
+        for chunk in text_chunks:
+            transcription_chunk = chunk if text_label == "Audio" else ""
+            pdf_chunk = chunk if text_label == "PDF" else ""
+            organized_record = organize_clinical_record(updated_text, transcription_chunk, pdf_chunk)
+            if organized_record:
+                updated_text = organized_record.content
+            else:
+                # Handle error
+                print("Error processing chunk.")
+                continue
+    return updated_text, "Información de depuración"
 # Configuración del tema
 theme = gr.themes.Base(
     )
     current_state = gr.State(value=initial_text)
     audio_filepath = gr.Audio(sources=["microphone"], type="filepath", label="Entrada de Audio")
+    pdf_files = gr.File(file_types=[".pdf"], label="Subir PDF", file_count="multiple")
     debug_output = gr.Textbox(label="Información de Depuración", lines=10)
     # Función para capturar cambios en el iterative_output