Informações sobre o documento
Neste fluxo, um documento de origem é inserido e um agente de IA é utilizado para analisar o seu conteúdo. Com base nos tópicos e conceitos-chave identificados, o agente utiliza uma ferramenta de pesquisa na web para encontrar recursos externos relevantes.
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ChatOutput-bqka0[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-bqka0 stroke:#a170ff
ParseData-sqlix[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Obtener Texto]
style ParseData-sqlix stroke:#a170ff
SearXng-5volz[Web Search SearXng]
style SearXng-5volz stroke:#a170ff
OpenAIModel-nkq0m[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-nkq0m stroke:#a170ff
LanggraphReactAgent-dtv48[Agent]
style LanggraphReactAgent-dtv48 stroke:#a170ff
GDriveFilesComponent-f0or9[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Obtener Documento]
style GDriveFilesComponent-f0or9 stroke:#a170ff
ParseData-sqlix -.- LanggraphReactAgent-dtv48
linkStyle 0 stroke:#a170ff
LanggraphReactAgent-dtv48 -.- ChatOutput-bqka0
linkStyle 1 stroke:#a170ff
SearXng-5volz -.- LanggraphReactAgent-dtv48
linkStyle 2 stroke:#a170ff
OpenAIModel-nkq0m -.- LanggraphReactAgent-dtv48
linkStyle 3 stroke:#a170ff
GDriveFilesComponent-f0or9 -.- ParseData-sqlix
linkStyle 4 stroke:#a170ff
📄 Fluxo de Trabalho Document Insights
🧩 Visão Geral
O fluxo de trabalho Document Insights ingere um documento do Google Drive, extrai seu conteúdo em texto simples e utiliza um agente de IA para analisar o texto.
Com base nos tópicos identificados, o agente realiza pesquisas na web usando uma instância do SearXNG e retorna uma lista de recursos externos relevantes em um formato de chat. Este processo de ponta a ponta facilita a pesquisa e a sumarização de conhecimento para qualquer documento.
⚙️ Funcionalidades Principais
- Recuperação direta de documentos do Google Drive por meio de um componente dedicado.
- Conversão automática de arquivos em formatos ricos para texto simples pronto para análise.
- Agente pré-construído Langgraph React que interpreta o texto, decide o que pesquisar e gerencia chamadas a ferramentas externas.
- Integração com o motor de busca SearXNG para obter referências atualizadas na web.
- Apresentação da lista final de recursos em formato de mensagem de chat.
🔄 Etapas do Fluxo
| Componente | Papel no Fluxo | Entradas Principais | Saídas Principais |
|---|---|---|---|
| Obtener Documento | Recupera um arquivo especificado no Google Drive. | Seleção de arquivo (ID ou escolha), operação Get. | Data – conteúdo bruto do arquivo e metadados |
| Obtener Texto | Converte os dados recuperados em texto simples usando um template. | Data do Obtener Documento; template {text} |
Text – texto extraído do documento |
| OpenAI | Fornece o modelo de linguagem que alimenta o raciocínio do agente. | Nome do modelo (ex.: gpt‑4o‑mini), parâmetros opcionais (temperatura, max tokens) | LanguageModel – instância pronta para uso |
| Web Search (SearXNG) | Cria uma ferramenta de busca que consulta uma instância do SearXNG. | Consulta de busca (saída do agente), máximo de resultados (30) | Tool – interface de busca web chamável |
| Agent | Orquestra a conversa: recebe o texto do documento, utiliza o LLM e chama a ferramenta de busca quando necessário. | input_value – texto do Obtener Texto; llm do OpenAI; tools do Web Search |
Response – mensagem contendo lista de links web |
| Chat Output | Apresenta a resposta do agente em formato de chat. | input_value – Response do Agent |
Message – saída final exibida ao usuário |
🧠 Notas
- Credenciais: É necessário possuir credenciais do Google Drive para o Obtener Documento e uma chave de API OpenAI para o OpenAI.
- Acessibilidade SearXNG: A instância do SearXNG deve ser acessível a partir do ambiente em que o fluxo é executado; caso contrário, a ferramenta de busca falhará.
- Limites de Iteração: O agente está configurado para um máximo de 50 iterações e 10 segundos por execução para evitar loops infinitos.
- Fallback: Nenhum LLM de fallback está conectado; o fluxo será interrompido se o modelo principal estiver indisponível.
- Privacidade de Dados: O fluxo apenas lê o conteúdo do arquivo e realiza buscas externas; nenhum dado é armazenado persistentemente além da sessão, a menos que configurado explicitamente.
- Extensibilidade: Ferramentas adicionais ou resumidores de memória podem ser conectados ao agente modificando
toolsou habilitandouse_summarizer.