Conversor de Ticket a JSON
Este flujo, denominado "Ticket to JSON", tiene como objetivo principal extraer información detallada de un ticket y estructurar esos datos en un formato JSON.
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
TextInput-7a156[<div><img src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>instrucciones]
style TextInput-7a156 stroke:#a170ff
ChatOutput-ol8bm[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-ol8bm stroke:#a170ff
OpenAIModel-d3ck8[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-d3ck8 stroke:#a170ff
TextInput-cv9yq[<div><img src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>ImagenURL]
style TextInput-cv9yq stroke:#a170ff
DescribeImage-mc9qi[<div><img src="/_astro/image.segxnpQg.svg" style="height: 20px !important;width: 20px !important"/></div>Describe Image]
style DescribeImage-mc9qi stroke:#a170ff
ParseData-y6byo[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-y6byo stroke:#a170ff
ParseData-y6byo -.- ChatOutput-ol8bm
linkStyle 0 stroke:#a170ff
DescribeImage-mc9qi -.- ParseData-y6byo
linkStyle 1 stroke:#a170ff
TextInput-7a156 -.- DescribeImage-mc9qi
linkStyle 2 stroke:#a170ff
TextInput-cv9yq -.- DescribeImage-mc9qi
linkStyle 3 stroke:#a170ff
OpenAIModel-d3ck8 -.- DescribeImage-mc9qi
linkStyle 4 stroke:#a170ff
Conversor de Ticket a JSON
🧩 Descripción General
Este flujo de trabajo automatiza la extracción de datos estructurados de una imagen de un recibo de un restaurante de comida rápida. Procesa la información visual utilizando un modelo de IA con capacidades de visión, guiado por instrucciones específicas, y genera los detalles extraídos en un formato JSON limpio y estandarizado. Esto agiliza la entrada y el análisis de datos al convertir información no estructurada de una imagen en una estructura legible por máquina.
⚙️ Características Principales
- Procesa una imagen de un recibo de restaurante para identificar y extraer datos transaccionales clave.
- Utiliza un modelo de IA preconfigurado con capacidades de visión para analizar el contenido de la imagen.
- Aplica un conjunto detallado de instrucciones para guiar a la IA en la extracción de campos específicos como el nombre del restaurante, la fecha, los artículos y los totales financieros.
- Genera los datos extraídos como un objeto JSON estructurado, listo para integrarse con otros sistemas o bases de datos.
🔄 Pasos del Flujo de Trabajo
| Nombre del Componente | Rol en el Flujo de Trabajo | Entradas Clave | Salidas Clave |
|---|---|---|---|
| Entrada de Texto (Instrucciones) | Proporciona las reglas detalladas y el esquema para la extracción de datos. | Un bloque de texto que define el tipo de documento objetivo, la lista de campos a extraer y la estructura de salida JSON requerida. | Las instrucciones de extracción pasadas al modelo de IA. |
| Entrada de Texto (URL de la Imagen) | Suministra la imagen fuente del recibo a procesar. | Una URL que apunta a la imagen digital del ticket del restaurante. | La ubicación de la imagen pasada al componente de visión. |
| Modelo OpenAI | Sirve como el motor central de IA con capacidades de visión para analizar la imagen. | Configuración del modelo (por ejemplo, nombre del modelo, temperatura). | Una instancia configurada del modelo de lenguaje lista para tareas de visión. |
| Describir Imagen | Analiza la imagen del recibo proporcionada utilizando el modelo de IA y las instrucciones. | La URL de la imagen del recibo y las instrucciones de extracción. | Una descripción textual detallada del contenido de la imagen, estructurada según las instrucciones. |
| Analizar Datos | Convierte la descripción generada por la IA en un mensaje formateado. | Los datos estructurados generados por el componente Describir Imagen. | Un mensaje de texto limpio que contiene los datos extraídos. |
| Salida del Chat | Presenta el resultado JSON estructurado final al usuario. | El mensaje de texto formateado del componente Analizar Datos. | Los datos JSON estructurados finales mostrados en la interfaz del chat. |
🧠 Notas
- El flujo de trabajo está diseñado específicamente para recibos post-venta de restaurantes de comida rápida; su precisión puede variar con otros tipos de documentos.
- Se instruye al modelo de IA para que genere
nullpara cualquier campo solicitado que no esté claramente presente o sea identificable en la imagen del recibo. - El sistema requiere una URL válida para la imagen del recibo para poder procesarla.
- La salida tiene un formato estrictamente como un objeto JSON, garantizando la compatibilidad con procesos automatizados posteriores.