Inspirador Gráfico
Inspirador Gráfico es un Director de Arte especializado en transformar briefs ambiguos en conceptos visuales tangibles. El agente analiza el mensaje del cliente para generar tres direcciones creativas únicas, incluyendo logos, UI y branding. Gracias a su
Inspirador Gráfico
🧩 Descripción general
El flujo “Inspirador Gráfico” automatiza la generación de propuestas creativas a partir de briefs de clientes. El agente analiza la entrada textual, produce tres direcciones visuales distintas y genera imágenes de apoyo mediante la herramienta Gemini Image Generator. Los resultados se presentan de forma interactiva en el chat.
⚙️ Funcionalidades principales
- Recibe y procesa el mensaje del usuario junto a posibles archivos adjuntos.
- Utiliza un modelo de lenguaje avanzado (Gemini) para comprender y estructurar la información del brief.
- Emplea la herramienta Gemini Image Generator para crear imágenes representativas de cada dirección creativa.
- Devuelve al usuario una respuesta de chat con el contenido textual y las imágenes generadas.
- Mantiene un historial de conversación y permite la ampliación de la sesión con herramientas adicionales.
🔄 Pasos del flujo de trabajo
| Nombre del componente | Rol en el flujo | Entradas clave | Salidas clave |
|---|---|---|---|
| Chat Input | Captura la interacción inicial del usuario. | Texto del usuario, archivos adjuntos (opcional), identificador de conversación, ID de sesión. | Mensaje de entrada (Message) que incluye texto y metadatos. |
| Gemini (modelo de lenguaje) | Procesa el prompt del usuario y produce un texto estructurado. | Prompt, modelo seleccionado, parámetros de generación (temperatura, tokens máximos). | Mensaje de texto (Message) generado por el modelo. |
| Gemini Image Generator | Genera imágenes basadas en la descripción del agente. | Prompt de imagen, modelo de imagen, número de imágenes a generar. | Imagen binaria (Binary) lista para ser enviada al chat. |
| Agent | Integra la lógica de negocio: decide cuándo y cómo usar la herramienta de generación de imágenes y consolida la respuesta. | Mensaje del usuario (del Chat Input), modelo de lenguaje (Gemini), herramienta de generación de imágenes, parámetros de ejecución. | Mensaje de respuesta (Message) que contiene el texto final y la referencia a las imágenes. |
| Chat Output | Muestra la respuesta al usuario. | Mensaje de respuesta del agente, identificador de conversación y sesión. | Mensaje visualizado en el chat del usuario. |
Nota: Los nodos “Label Component” solo sirven para documentar el flujo y no participan en la ejecución.
🧠 Notas
- El agente puede ser extendido con más herramientas o modelos, pero actualmente utiliza Gemini como LLM y Gemini Image Generator como herramienta de creación visual.
- La memoria del agente se configura para ser persistente solo si se activa la opción
use_checkpointer. - El flujo incluye un mecanismo de control de errores: si el modelo de lenguaje falla, el agente puede recurrir a los modelos de respaldo definidos en
fallback_models. - Se permite el streaming de respuestas (
use_streamystream_thinking), lo que mejora la experiencia del usuario al recibir el contenido mientras se genera. - La generación de imágenes se limita a un máximo de 1 imagen por dirección creativa, pero el parámetro
num_imagespuede ajustarse según necesidad. - El sistema está preparado para manejar entradas en lote mediante las banderas
skip_if_empty_inputyskip_branch_if_empty_output.
Esta documentación proporciona una visión clara y concisa de cada componente y su interacción dentro del flujo “Inspirador Gráfico”, facilitando su comprensión y mantenimiento.