Conversor de Ticket a JSON
Este flujo, denominado "Ticket to JSON", tiene como objetivo principal extraer información detallada de un ticket y estructurar esos datos en un formato JSON.
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
TextInput-7a156[<div><img src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>instrucciones]
style TextInput-7a156 stroke:#a170ff
ChatOutput-ol8bm[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-ol8bm stroke:#a170ff
OpenAIModel-d3ck8[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-d3ck8 stroke:#a170ff
TextInput-cv9yq[<div><img src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>ImagenURL]
style TextInput-cv9yq stroke:#a170ff
DescribeImage-mc9qi[<div><img src="/_astro/image.segxnpQg.svg" style="height: 20px !important;width: 20px !important"/></div>Describe Image]
style DescribeImage-mc9qi stroke:#a170ff
ParseData-y6byo[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-y6byo stroke:#a170ff
ParseData-y6byo -.- ChatOutput-ol8bm
linkStyle 0 stroke:#a170ff
DescribeImage-mc9qi -.- ParseData-y6byo
linkStyle 1 stroke:#a170ff
TextInput-7a156 -.- DescribeImage-mc9qi
linkStyle 2 stroke:#a170ff
TextInput-cv9yq -.- DescribeImage-mc9qi
linkStyle 3 stroke:#a170ff
OpenAIModel-d3ck8 -.- DescribeImage-mc9qi
linkStyle 4 stroke:#a170ff
Conversor de Ticket para JSON
🧩 Visão Geral
Este fluxo de trabalho automatiza a extração de dados estruturados de uma imagem de recibo de um restaurante de fast-food. Ele processa a informação visual usando um modelo de IA com capacidades de visão, guiado por instruções específicas, e gera os detalhes extraídos em um formato JSON limpo e padronizado. Isso agiliza a entrada e análise de dados convertendo dados não estruturados de imagem em uma estrutura legível por máquina.
⚙️ Principais Funcionalidades
- Processa uma imagem de um recibo de restaurante para identificar e extrair dados transacionais-chave.
- Utiliza um modelo de IA pré-configurado com capacidades de visão para analisar o conteúdo da imagem.
- Aplica um conjunto detalhado de instruções para guiar a IA na extração de campos específicos como nome do restaurante, data, itens e totais financeiros.
- Gera os dados extraídos como um objeto JSON estruturado, pronto para integração com outros sistemas ou bancos de dados.
🔄 Etapas do Fluxo de Trabalho
| Nome do Componente | Função no Fluxo de Trabalho | Principais Entradas | Principais Saídas |
|---|---|---|---|
| Entrada de Texto (Instruções) | Fornece as regras detalhadas e o esquema para extração de dados. | Um bloco de texto definindo o tipo de documento alvo, a lista de campos a extrair e a estrutura de saída JSON necessária. | As instruções de extração passadas para o modelo de IA. |
| Entrada de Texto (URL da Imagem) | Fornece a imagem de origem do recibo a ser processada. | Uma URL apontando para a imagem digital do ticket do restaurante. | A localização da imagem passada para o componente de visão. |
| Modelo OpenAI | Serve como o motor central de IA com capacidades de visão para analisar a imagem. | Configuração do modelo (ex.: nome do modelo, temperatura). | Uma instância configurada do modelo de linguagem pronta para tarefas de visão. |
| Descrever Imagem | Analisa a imagem do recibo fornecida usando o modelo de IA e as instruções. | A URL da imagem do recibo e as instruções de extração. | Uma descrição textual detalhada do conteúdo da imagem, estruturada de acordo com as instruções. |
| Analisar Dados | Converte a descrição gerada pela IA em uma mensagem formatada. | A saída de dados estruturados do componente Descrever Imagem. | Uma mensagem de texto limpa contendo os dados extraídos. |
| Saída do Chat | Apresenta o resultado JSON estruturado final ao usuário. | A mensagem de texto formatada do componente Analisar Dados. | Os dados JSON estruturados finais exibidos na interface do chat. |
🧠 Notas
- O fluxo de trabalho é projetado especificamente para recibos pós-venda de restaurantes de fast-food; sua precisão pode variar com outros tipos de documento.
- O modelo de IA é instruído a gerar
nullpara qualquer campo solicitado que não esteja claramente presente ou identificável na imagem do recibo. - O sistema requer uma URL válida para a imagem do recibo para processar.
- A saída é estritamente formatada como um objeto JSON, garantindo compatibilidade com processos automatizados subsequentes.