Extrator de dados de faturas
Este fluxo automatiza o processo de extração de dados de faturas não estruturadas.
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ParseData-8kr6e[<div><img alt="logo" src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-8kr6e stroke:#a170ff
Prompt-0gsjq[<div><img alt="logo" src="/_astro/square-terminal.BMOXc-nZ.svg" style="height: 20px !important;width: 20px !important"/></div>Extractor de Informacion]
style Prompt-0gsjq stroke:#a170ff
OpenAIModel-m3qyl[<div><img alt="logo" src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-m3qyl stroke:#a170ff
TextInput-84vxn[<div><img alt="logo" src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>Text Input]
style TextInput-84vxn stroke:#a170ff
GDriveFilesComponent-7oth8[<div><img alt="logo" src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Drive File Manager]
style GDriveFilesComponent-7oth8 stroke:#a170ff
TextOutput-0lnck[<div><img alt="logo" src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>Text Output]
style TextOutput-0lnck stroke:#a170ff
ParseData-8kr6e -.- Prompt-0gsjq
linkStyle 0 stroke:#a170ff
Prompt-0gsjq -.- OpenAIModel-m3qyl
linkStyle 1 stroke:#a170ff
GDriveFilesComponent-7oth8 -.- ParseData-8kr6e
linkStyle 2 stroke:#a170ff
TextInput-84vxn -.- GDriveFilesComponent-7oth8
linkStyle 3 stroke:#a170ff
OpenAIModel-m3qyl -.- TextOutput-0lnck
linkStyle 4 stroke:#a170ff
🧩 Descrição Geral
Este fluxo automatiza a extração de informações estruturadas de faturas recebidas em formato não estruturado. Ele obtém o arquivo de um repositório do Google Drive, converte seu conteúdo em texto, gera um prompt detalhado para a IA, extrai os campos-chave com o modelo OpenAI e exibe o resultado na interface do Playground.
⚙️ Funcionalidades Principais
- Recupera arquivos de faturas de pastas especificadas no Google Drive.
- Converte o conteúdo dos arquivos em texto legível, incluindo OCR quando necessário.
- Estrutura o texto em um prompt padronizado para extração de dados.
- Utiliza um modelo OpenAI para analisar o prompt e gerar um resumo em JSON.
- Exibe a resposta JSON no Playground para visualização imediata.
🔄 Passos do Fluxo de Trabalho
| Nome do Componente | Papel no Fluxo | Entradas Principais | Saídas Principais |
|---|---|---|---|
| Text Input | Recebe a URL da pasta de origem no Google Drive | URL da pasta | — |
| Drive File Manager | Busca o arquivo de fatura na pasta indicada | URL da pasta | Dados do arquivo (texto, metadados) |
| Parse Data | Converte o arquivo em texto plano | Dados do arquivo | Texto extraído, dados processados |
| Prompt | Constrói um prompt detalhado a partir do texto extraído | Texto extraído | Prompt completo |
| OpenAI Model | Processa o prompt para extrair campos da fatura | Prompt completo | Resposta JSON (dados extraídos) |
| Text Output | Exibe o resultado final no Playground | Resposta JSON | Texto exibido |
🧠 Notas
- O fluxo depende de credenciais válidas do Google Drive para acesso ao arquivo e de uma chave de API do OpenAI para o modelo.
- A extração de texto pode incluir OCR, caso o arquivo contenha apenas imagens.
- O prompt é formatado de maneira que a IA extraia: número de fatura, datas, emissores, subtotais, impostos e total.
- O modelo está configurado em “JSON Mode” para garantir que a resposta esteja estruturada em JSON.
- Caso a pasta de origem esteja vazia ou o arquivo não seja encontrado, o fluxo encerra sem erro, retornando
None. - O componente Label Component está presente no diagrama mas não está conectado ao fluxo principal; pode ser usado para anotações visuais no Playground.