Perspectivas de documentos
En este flujo se ingiere un documento fuente y utiliza un agente de IA para analizar su contenido. Basado en los temas y conceptos clave identificados, el agente utiliza una herramienta de búsqueda web para encontrar recursos externos relevantes
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ChatOutput-bqka0[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-bqka0 stroke:#a170ff
ParseData-sqlix[<div><img src="/_astro/braces.Djq0PW4_.svg" style="height: 20px !important;width: 20px !important"/></div>Obtener Texto]
style ParseData-sqlix stroke:#a170ff
SearXng-5volz[Web Search SearXng]
style SearXng-5volz stroke:#a170ff
OpenAIModel-nkq0m[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-nkq0m stroke:#a170ff
LanggraphReactAgent-dtv48[Agent]
style LanggraphReactAgent-dtv48 stroke:#a170ff
GDriveFilesComponent-f0or9[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Obtener Documento]
style GDriveFilesComponent-f0or9 stroke:#a170ff
ParseData-sqlix -.- LanggraphReactAgent-dtv48
linkStyle 0 stroke:#a170ff
LanggraphReactAgent-dtv48 -.- ChatOutput-bqka0
linkStyle 1 stroke:#a170ff
SearXng-5volz -.- LanggraphReactAgent-dtv48
linkStyle 2 stroke:#a170ff
OpenAIModel-nkq0m -.- LanggraphReactAgent-dtv48
linkStyle 3 stroke:#a170ff
GDriveFilesComponent-f0or9 -.- ParseData-sqlix
linkStyle 4 stroke:#a170ff
📄 Perspectivas de Documentos
🧩 Descripción general
Este flujo permite analizar de forma automática el contenido de un documento almacenado en Google Drive, extraer su texto y, mediante un agente de IA preconstruido, proponer páginas web relevantes que faciliten la comprensión del material. El proceso combina la extracción de datos, la generación de respuestas con un modelo de lenguaje y la búsqueda web con la herramienta SearXng, mostrando los resultados finales en un chat interactivo.
⚙️ Funcionalidades principales
- Obtener Documento: recupera un archivo seleccionado en Google Drive y devuelve su contenido.
- Obtener Texto: convierte el contenido del archivo en texto plano siguiendo una plantilla definida.
- Agent: procesa la información con un modelo de lenguaje, emplea búsqueda web y sintetiza una lista de páginas recomendadas.
- Web Search (SearXng): ejecuta consultas en la red mediante SearXng y devuelve resultados relevantes.
- OpenAI: genera respuestas estructuradas en lenguaje natural usando el modelo gpt‑4o‑mini.
- Chat Output: muestra el resultado final en un formato de chat, permitiendo la interacción con el usuario.
🔄 Pasos del flujo de trabajo
| Nombre del componente | Rol en el flujo | Entradas clave | Salidas clave |
|---|---|---|---|
| Obtener Documento | Recupera el archivo de Google Drive y entrega su contenido. | Id o ruta del archivo, modo de operación | Datos de archivo |
| Obtener Texto | Extrae el texto plano del contenido del archivo. | Datos de archivo | Texto extraído |
| Agent | Interpreta el texto, busca información complementaria y produce una respuesta. | Texto extraído (input_value), Modelo de lenguaje (llm), Herramientas (tools) | Respuesta del agente |
| Web Search (SearXng) | Proporciona la herramienta de búsqueda web al agente. | Consulta de búsqueda | Resultado de búsqueda (Tool) |
| OpenAI | Genera respuestas en lenguaje natural y devuelve el modelo para el agente. | Prompt, Configuración del modelo | Modelo de lenguaje (model_output) |
| Chat Output | Presenta la respuesta del agente en la interfaz de chat. | Respuesta del agente (input_value) | Mensaje de chat |
Secuencia de ejecución
- Obtener Documento → 2. Obtener Texto → 3. Agent (utiliza OpenAI y Web Search (SearXng)) → 4. Chat Output.
🧠 Notas
- El agente utiliza un modelo de lenguaje gpt‑4o‑mini con una configuración de temperatura baja (0.1) para garantizar respuestas coherentes y centradas en la consulta.
- La herramienta SearXng se emplea en modo “Mapping” por defecto, lo que permite procesar múltiples resultados de búsqueda de forma eficiente.
- El flujo está diseñado para ejecutarse en un entorno con credenciales válidas de Google Drive y OpenAI; la ausencia de dichas credenciales provocará errores de autorización.
- El componente Obtener Documento admite diversas operaciones (Get, Upload, etc.) y se configura para la operación Get por defecto, recuperando únicamente el contenido del archivo seleccionado.
- Todos los componentes están conectados por edges que garantizan la correcta transmisión de datos entre ellos; cualquier cambio en la topología requerirá una revisión de las conexiones.
- Los datos de salida de cada paso se presentan de manera legible y no incluyen identificadores internos, facilitando su lectura y depuración.