Extractor de datos de facturas
Este flujo automatiza el proceso de extracción de datos de facturas no estructuradas
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ParseData-8kr6e[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Parse Data]
style ParseData-8kr6e stroke:#a170ff
Prompt-0gsjq[<div><img src="/_astro/square-terminal.BMOXc-nZ.svg" style="height: 20px !important;width: 20px !important"/></div>Extractor de Informacion]
style Prompt-0gsjq stroke:#a170ff
OpenAIModel-m3qyl[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-m3qyl stroke:#a170ff
TextInput-84vxn[<div><img src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>Text Input]
style TextInput-84vxn stroke:#a170ff
GDriveFilesComponent-7oth8[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Drive File Manager]
style GDriveFilesComponent-7oth8 stroke:#a170ff
TextOutput-0lnck[<div><img src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>Text Output]
style TextOutput-0lnck stroke:#a170ff
ParseData-8kr6e -.- Prompt-0gsjq
linkStyle 0 stroke:#a170ff
Prompt-0gsjq -.- OpenAIModel-m3qyl
linkStyle 1 stroke:#a170ff
GDriveFilesComponent-7oth8 -.- ParseData-8kr6e
linkStyle 2 stroke:#a170ff
TextInput-84vxn -.- GDriveFilesComponent-7oth8
linkStyle 3 stroke:#a170ff
OpenAIModel-m3qyl -.- TextOutput-0lnck
linkStyle 4 stroke:#a170ff
Extrator de Dados de Faturas
🧩 Visão Geral
Este fluxo de trabalho automatiza a extração de dados estruturados de documentos de faturas não estruturados. Ele ingere um arquivo de fatura de uma fonte como o Google Drive, processa seu conteúdo e usa um modelo de linguagem grande para identificar e retornar com precisão campos-chave, como números de fatura, datas, detalhes do remetente e do destinatário, e totais financeiros. Este processo transforma dados brutos de documentos em um formato limpo e estruturado, adequado para análise posterior ou manutenção de registros.
⚙️ Principais Funcionalidades
- Recupera automaticamente arquivos de faturas de uma pasta específica do Google Drive.
- Converte dados brutos do arquivo em texto simples para processamento.
- Usa um prompt estruturado e detalhado para orientar um modelo de IA na extração de campos específicos da fatura.
- Retorna os dados estruturados extraídos em um formato claro e legível.
🔄 Etapas do Fluxo de Trabalho
| Nome do Componente | Função no Fluxo de Trabalho | Principais Entradas | Principais Saídas |
|---|---|---|---|
| Entrada de Texto | Fornece o URL da pasta do Google Drive que contém o arquivo da fatura. | URL da Pasta | URL da Pasta |
| Gerenciador de Arquivos do Drive | Recupera o arquivo da fatura da pasta especificada do Google Drive. | URL da Pasta | Dados Brutos do Arquivo |
| Analisar Dados | Converte os dados brutos do arquivo em texto simples para o modelo de IA ler. | Dados Brutos do Arquivo | Dados de Texto da Fatura |
| Extrator de Informações (Prompt) | Constrói uma instrução detalhada para o modelo de IA, especificando quais pontos de dados extrair do texto da fatura. | Dados de Texto da Fatura | Prompt de Extração Estruturado |
| Modelo OpenAI | Analisa o texto da fatura usando o prompt fornecido e extrai os dados estruturados solicitados. | Prompt de Extração Estruturado | Dados da Fatura Extraídos |
| Saída de Texto | Exibe os dados estruturados finais da fatura extraídos pelo modelo de IA. | Dados da Fatura Extraídos | Saída Estruturada Final |
🧠 Notas
- O fluxo de trabalho foi projetado para lidar com documentos de faturas não estruturados, como PDFs ou imagens, convertendo-os primeiro em texto.
- A precisão da extração de dados depende da qualidade do documento de origem e da clareza da conversão de texto.
- Uma chave de API válida do OpenAI e credenciais do Google Drive são necessárias para o funcionamento dos respectivos componentes.
- O modelo está configurado para saída determinística com uma temperatura baixa para garantir resultados de extração consistentes.