QA de documentos
Este flujo de trabajo es un sistema diseñado para responder preguntas sobre el contenido de un documento específico guardado en Google Drive. Actúa como un asistente que puede "leer" un archivo y responder a consultas sobre su información.
+3
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ChatInput-t1dhv[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Input]
style ChatInput-t1dhv stroke:#a170ff
OpenAIModel-b5y7n[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-b5y7n stroke:#a170ff
ChatOutput-eun7o[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-eun7o stroke:#a170ff
GDriveFilesComponent-mgn88[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Google Drive File Manager]
style GDriveFilesComponent-mgn88 stroke:#a170ff
ParseData-kfvde[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-kfvde stroke:#a170ff
Prompt-qq08j[<div><img src="/_astro/square-terminal.BMOXc-nZ.svg" style="height: 20px !important;width: 20px !important"/></div>Prompt2]
style Prompt-qq08j stroke:#a170ff
OpenAIModel-b5y7n -.- ChatOutput-eun7o
linkStyle 0 stroke:#a170ff
GDriveFilesComponent-mgn88 -.- ParseData-kfvde
linkStyle 1 stroke:#a170ff
ParseData-kfvde -.- Prompt-qq08j
linkStyle 2 stroke:#a170ff
ChatInput-t1dhv -.- Prompt-qq08j
linkStyle 3 stroke:#a170ff
Prompt-qq08j -.- OpenAIModel-b5y7n
linkStyle 4 stroke:#a170ff
Documentación del flujo de trabajo “QA de documentos”
🧩 Descripción general
El flujo permite responder preguntas sobre el contenido de un documento almacenado en Google Drive.
Al recibir una consulta del usuario y la referencia al archivo, el sistema extrae, procesa y combina el texto del documento con la pregunta, envía el prompt resultante a un modelo de OpenAI y devuelve la respuesta al chat.
⚙️ Funcionalidades principales
- Gestión de archivos en Google Drive para obtener el contenido del documento.
- Procesamiento de datos que convierte la información del archivo en texto plano.
- Construcción de prompt con la plantilla definida, incorporando el documento y la pregunta.
- Generación de respuestas mediante un modelo de lenguaje OpenAI.
- Salida de chat que entrega la respuesta al usuario en la interfaz de conversación.
🔄 Pasos del flujo de trabajo
| Nombre del componente | Rol en el flujo | Entradas clave | Salidas clave |
|---|---|---|---|
| Entrada de chat | Recibe la pregunta del usuario y la sesión. | Texto del usuario, ID de conversación, archivos opcionales | Mensaje de entrada |
| Gestor de archivos de Google Drive | Obtiene el documento especificado en Drive. | ID del archivo, operación “Get” | Contenido del archivo (Data) |
| Parseador de datos | Convierte el contenido del archivo en texto plano. | Datos del archivo | Texto del documento |
| Generador de Prompt | Crea el prompt combinando documento y pregunta. | Documento (texto), Pregunta (texto) | Prompt completo |
| Modelo de OpenAI | Genera la respuesta a partir del prompt. | Prompt (texto) | Texto generado |
| Salida de chat | Muestra la respuesta al usuario. | Texto generado | Mensaje de salida |
🧠 Notas
- El gestor de archivos necesita el ID del archivo de Google Drive y que el usuario tenga permisos de lectura.
- El parseador de datos trabaja únicamente con texto; los archivos binarios se convierten a texto plano antes de ser procesados.
- La plantilla del prompt está diseñada para que el modelo se base exclusivamente en el contenido del documento y la pregunta, sin inferencias externas.
- Se requiere una clave válida de OpenAI y una configuración correcta del modelo (
gpt-4o-mini). - El flujo no incluye lógica de manejo de errores ni reintentos; cualquier fallo en la obtención del archivo o en la llamada al modelo se propaga al chat.