Extractor de datos de factura
Este flujo automatiza el proceso de extracción de datos de facturas no estructuradas
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ParseData-8kr6e[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-8kr6e stroke:#a170ff
Prompt-0gsjq[<div><img src="/_astro/square-terminal.BMOXc-nZ.svg" style="height: 20px !important;width: 20px !important"/></div>Extractor de Informacion]
style Prompt-0gsjq stroke:#a170ff
OpenAIModel-m3qyl[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-m3qyl stroke:#a170ff
ChatOutput-jbpok[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-jbpok stroke:#a170ff
GDriveFilesComponent-ls7bc[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Google Drive File Manager]
style GDriveFilesComponent-ls7bc stroke:#a170ff
ParseData-8kr6e -.- Prompt-0gsjq
linkStyle 0 stroke:#a170ff
Prompt-0gsjq -.- OpenAIModel-m3qyl
linkStyle 1 stroke:#a170ff
OpenAIModel-m3qyl -.- ChatOutput-jbpok
linkStyle 2 stroke:#a170ff
GDriveFilesComponent-ls7bc -.- ParseData-8kr6e
linkStyle 3 stroke:#a170ff
Extractor de datos de factura
🧩 Descripción general
Este flujo automatiza la extracción de datos estructurados de facturas no estructuradas.
Comienza cargando el documento desde Google Drive, lo convierte en texto legible y lo envía a un modelo de IA para extraer los campos clave. La respuesta generada se muestra al usuario en una interfaz de chat.
⚙️ Funcionalidades principales
- Carga de archivos en Google Drive y gestión de permisos.
- Parseo de la factura a texto plano siguiendo una plantilla definida.
- Generación de prompt dinámico que solicita al modelo los campos de la factura.
- Inferencia con el modelo OpenAI para obtener la información estructurada.
- Visualización de la respuesta como un mensaje de chat interactivo.
🔄 Pasos del flujo de trabajo
| Nombre del componente | Rol en el flujo | Entradas clave | Salidas clave |
|---|---|---|---|
| Google Drive Files Component | Recupera el archivo de Google Drive y lo convierte en datos procesables. | Archivo seleccionado en Google Drive y parámetros de operación (tipo de acción, ruta de carpeta, etc.). | Datos binarios y metadatos del archivo (Data). |
| Parse Data | Convierte los datos binarios de la factura en texto legible, aplicando una plantilla. | Datos binarios de la factura (Data). | Texto formateado de la factura y datos procesados. |
| Prompt | Construye un prompt con la plantilla de extracción y los datos de la factura. | Texto de la factura (invoice_data). | Prompt completo listo para la inferencia. |
| OpenAI Model | Ejecuta el modelo de IA (gpt‑4o) sobre el prompt y devuelve la respuesta. | Prompt generado (input_value). | Respuesta de texto (text_output). |
| Chat Output | Muestra la respuesta generada en la interfaz de chat. | Respuesta de texto (input_value). | Mensaje de chat presentado al usuario. |
🧠 Notas
- El flujo asume que la factura está en un formato que el modelo de IA pueda procesar (PDF, texto, etc.).
- Se requiere una credencial válida tanto para Google Drive como para el acceso a la API de OpenAI.
- El modelo utilizado es gpt‑4o; el comportamiento puede variar con otros modelos o configuraciones.
- La plantilla del prompt debe incluir explícitamente los campos que se desean extraer para garantizar la precisión.
- Se recomienda revisar la calidad del texto extraído antes de enviarlo al modelo para evitar errores de interpretación.