graph TD %%{init: {'theme': 'mc','layout': 'elk'}}%% ChatInput-g80eg[<div><img alt="logo" src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Input] style ChatInput-g80eg stroke:#a170ff AdvancedAgent-sj22e[Agent] style AdvancedAgent-sj22e stroke:#a170ff GoogleGenerativeAIModel-t580h[Gemini] style GoogleGenerativeAIModel-t580h stroke:#a170ff GeminiImageGenerator-k3t74[Gemini Image Generator] style GeminiImageGenerator-k3t74 stroke:#a170ff ChatOutput-64ffn[<div><img alt="logo" src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output] style ChatOutput-64ffn stroke:#a170ff ChatInput-g80eg -.- AdvancedAgent-sj22e linkStyle 0 stroke:#a170ff GoogleGenerativeAIModel-t580h -.- AdvancedAgent-sj22e linkStyle 1 stroke:#a170ff GeminiImageGenerator-k3t74 -.- AdvancedAgent-sj22e linkStyle 2 stroke:#a170ff AdvancedAgent-sj22e -.- ChatOutput-64ffn linkStyle 3 stroke:#a170ff

Inspirador Gráfico

🧩 Descripción general

El flujo “Inspirador Gráfico” automatiza la generación de propuestas creativas a partir de briefs de clientes. El agente analiza la entrada textual, produce tres direcciones visuales distintas y genera imágenes de apoyo mediante la herramienta Gemini Image Generator. Los resultados se presentan de forma interactiva en el chat.

⚙️ Funcionalidades principales

Recibe y procesa el mensaje del usuario junto a posibles archivos adjuntos.
Utiliza un modelo de lenguaje avanzado (Gemini) para comprender y estructurar la información del brief.
Emplea la herramienta Gemini Image Generator para crear imágenes representativas de cada dirección creativa.
Devuelve al usuario una respuesta de chat con el contenido textual y las imágenes generadas.
Mantiene un historial de conversación y permite la ampliación de la sesión con herramientas adicionales.

🔄 Pasos del flujo de trabajo

Nombre del componente	Rol en el flujo	Entradas clave	Salidas clave
Chat Input	Captura la interacción inicial del usuario.	Texto del usuario, archivos adjuntos (opcional), identificador de conversación, ID de sesión.	Mensaje de entrada (`Message`) que incluye texto y metadatos.
Gemini (modelo de lenguaje)	Procesa el prompt del usuario y produce un texto estructurado.	Prompt, modelo seleccionado, parámetros de generación (temperatura, tokens máximos).	Mensaje de texto (`Message`) generado por el modelo.
Gemini Image Generator	Genera imágenes basadas en la descripción del agente.	Prompt de imagen, modelo de imagen, número de imágenes a generar.	Imagen binaria (`Binary`) lista para ser enviada al chat.
Agent	Integra la lógica de negocio: decide cuándo y cómo usar la herramienta de generación de imágenes y consolida la respuesta.	Mensaje del usuario (del Chat Input), modelo de lenguaje (Gemini), herramienta de generación de imágenes, parámetros de ejecución.	Mensaje de respuesta (`Message`) que contiene el texto final y la referencia a las imágenes.
Chat Output	Muestra la respuesta al usuario.	Mensaje de respuesta del agente, identificador de conversación y sesión.	Mensaje visualizado en el chat del usuario.

Nota: Los nodos “Label Component” solo sirven para documentar el flujo y no participan en la ejecución.

🧠 Notas

El agente puede ser extendido con más herramientas o modelos, pero actualmente utiliza Gemini como LLM y Gemini Image Generator como herramienta de creación visual.
La memoria del agente se configura para ser persistente solo si se activa la opción use_checkpointer.
El flujo incluye un mecanismo de control de errores: si el modelo de lenguaje falla, el agente puede recurrir a los modelos de respaldo definidos en fallback_models.
Se permite el streaming de respuestas (use_stream y stream_thinking), lo que mejora la experiencia del usuario al recibir el contenido mientras se genera.
La generación de imágenes se limita a un máximo de 1 imagen por dirección creativa, pero el parámetro num_images puede ajustarse según necesidad.
El sistema está preparado para manejar entradas en lote mediante las banderas skip_if_empty_input y skip_branch_if_empty_output.

Esta documentación proporciona una visión clara y concisa de cada componente y su interacción dentro del flujo “Inspirador Gráfico”, facilitando su comprensión y mantenimiento.