Extrator de dados de faturas
Este fluxo automatiza o processo de extração de dados de faturas não estruturadas.
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ParseData-8kr6e[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-8kr6e stroke:#a170ff
Prompt-0gsjq[<div><img src="/_astro/square-terminal.BMOXc-nZ.svg" style="height: 20px !important;width: 20px !important"/></div>Extractor de Informacion]
style Prompt-0gsjq stroke:#a170ff
OpenAIModel-m3qyl[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-m3qyl stroke:#a170ff
ChatOutput-jbpok[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-jbpok stroke:#a170ff
GDriveFilesComponent-ls7bc[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Google Drive File Manager]
style GDriveFilesComponent-ls7bc stroke:#a170ff
ParseData-8kr6e -.- Prompt-0gsjq
linkStyle 0 stroke:#a170ff
Prompt-0gsjq -.- OpenAIModel-m3qyl
linkStyle 1 stroke:#a170ff
OpenAIModel-m3qyl -.- ChatOutput-jbpok
linkStyle 2 stroke:#a170ff
GDriveFilesComponent-ls7bc -.- ParseData-8kr6e
linkStyle 3 stroke:#a170ff
Extrator de Dados de Fatura
🧩 Visão Geral
O fluxo Extrator de Dados de Fatura automatiza a extração de informações estruturadas de arquivos de fatura não estruturados armazenados no Google Drive. Ele converte o arquivo em texto simples, gera um prompt de extração direcionado, consulta um modelo OpenAI e entrega os dados extraídos em um formato amigável para chat.
⚙️ Funcionalidades Principais
- Recupera um arquivo de fatura no Google Drive com base em parâmetros especificados pelo usuário.
- Analisa o conteúdo do arquivo e o transforma em uma única string de texto para processamento posterior.
- Constrói um prompt dinâmico que lista os campos específicos a serem extraídos da fatura.
- Envia o prompt para um modelo de linguagem OpenAI e obtém os resultados da extração.
- Formata a saída do modelo como uma mensagem de chat para revisão fácil.
🔄 Etapas do Fluxo
| Componente | Papel no Fluxo | Entradas Principais | Saídas Principais |
|---|---|---|---|
| Google Drive File Manager | Acessa o arquivo de fatura no Google Drive e retorna seu conteúdo. | File ID ou seleção, modo de operação (ex.: Get), credenciais | Data (conteúdo do arquivo) |
| Parse Data | Converte os dados brutos do arquivo em texto simples usando um template definido pelo usuário. | Data (conteúdo do arquivo) | Text (dados da fatura como string) |
| Prompt Component | Cria um prompt detalhado de extração que enumera os campos desejados da fatura. | Dados da fatura (texto) | Prompt Message (texto) |
| OpenAI Model | Gera os resultados da extração avaliando o prompt com o modelo selecionado. | Prompt Message | Text (resposta do modelo contendo os campos extraídos) |
| Chat Output | Apresenta a resposta do modelo como uma mensagem em estilo chat. | Resposta do modelo (texto) | Chat Message (saída exibida) |
Observação: O componente Label é usado apenas para exibir a descrição do fluxo e não participa do processamento de dados.
🧠 Notas
- O componente Google Drive requer credenciais OAuth apropriadas, e o arquivo especificado deve estar acessível com o modo de operação selecionado.
- O Parse Data depende de um template; o template padrão retorna apenas o texto, mas pode ser personalizado para filtrar ou reformatar a entrada.
- O Prompt Component deve incluir todos os campos alvo; o modelo OpenAI só extrairá o que for explicitamente solicitado no prompt.
- O fluxo utiliza o modelo gpt‑4o por padrão, mas o nome do modelo pode ser alterado para atender a requisitos de custo ou desempenho.
- A saída do modelo deve ser revisada quanto à precisão; o fluxo assume que o prompt está formulado para retornar resultados em formato claro e estruturado.
- O Chat Output apresenta o texto final, mas não valida nem processa os dados; sistemas posteriores podem ingerir o conteúdo da mensagem, se necessário.