Agente de presentaciones en Google Slides
El flujo automatiza por completo la creación y edición de presentaciones a partir de las instrucciones proporcionadas por el usuario.
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ChatInput-wcyi5[<div><img alt="logo" src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Input]
style ChatInput-wcyi5 stroke:#a170ff
googleslidescomponent-0l523[Reemplazar texto]
style googleslidescomponent-0l523 stroke:#a170ff
ChatOutput-jf3v6[<div><img alt="logo" src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-jf3v6 stroke:#a170ff
googleslidescomponent-pmjen[Reemplazar Imagen]
style googleslidescomponent-pmjen stroke:#a170ff
AdvancedAgent-lja6y[SlideAgent]
style AdvancedAgent-lja6y stroke:#a170ff
googleslidescomponent-o2b5l[Obtener Presentación]
style googleslidescomponent-o2b5l stroke:#a170ff
GeminiImageGenerator-9mfx6[Gemini Image Generator]
style GeminiImageGenerator-9mfx6 stroke:#a170ff
googleslidescomponent-xa0zm[Crear Slides]
style googleslidescomponent-xa0zm stroke:#a170ff
googleslidescomponent-x60d0[Obtener thumbnail]
style googleslidescomponent-x60d0 stroke:#a170ff
DeepseekModel-8gvrz[Deepseek]
style DeepseekModel-8gvrz stroke:#a170ff
googleslidescomponent-pmjen -.- AdvancedAgent-lja6y
linkStyle 0 stroke:#a170ff
googleslidescomponent-o2b5l -.- AdvancedAgent-lja6y
linkStyle 1 stroke:#a170ff
GeminiImageGenerator-9mfx6 -.- AdvancedAgent-lja6y
linkStyle 2 stroke:#a170ff
ChatInput-wcyi5 -.- AdvancedAgent-lja6y
linkStyle 3 stroke:#a170ff
AdvancedAgent-lja6y -.- ChatOutput-jf3v6
linkStyle 4 stroke:#a170ff
googleslidescomponent-0l523 -.- AdvancedAgent-lja6y
linkStyle 5 stroke:#a170ff
googleslidescomponent-xa0zm -.- AdvancedAgent-lja6y
linkStyle 6 stroke:#a170ff
googleslidescomponent-x60d0 -.- AdvancedAgent-lja6y
linkStyle 7 stroke:#a170ff
DeepseekModel-8gvrz -.- AdvancedAgent-lja6y
linkStyle 8 stroke:#a170ff
📄 Documentación del flujo “Agente de presentaciones en Google Slides”
🧩 Descripción general
El flujo automatiza la creación y edición de presentaciones de Google Slides a partir de las instrucciones del usuario. Un agente de inteligencia artificial interpreta la solicitud, genera el contenido textual con Deepseek, crea la presentación, inserta texto y reemplaza imágenes mediante Gemini y las APIs de Google Slides, y devuelve el resultado final al usuario.
⚙️ Funcionalidades principales
- Recibe la solicitud del usuario, incluyendo texto y archivos adjuntos.
- El agente de presentación coordina el proceso y selecciona las herramientas adecuadas.
- Deepseek genera los textos descriptivos y de título de cada diapositiva.
- Gemini Image Generator crea las imágenes visuales solicitadas.
- Se crea una nueva presentación a partir de una plantilla.
- Se reemplaza el texto en las diapositivas correspondientes.
- Se sustituyen las imágenes antiguas por las nuevas generadas.
- Se obtienen los IDs de miniaturas para poder referenciar las imágenes.
- El flujo entrega la presentación final como respuesta al usuario.
🔄 Pasos del flujo de trabajo
| Nombre del componente | Rol en el flujo | Entradas clave | Salidas clave |
|---|---|---|---|
| Chat Input | Captura la solicitud del usuario. | Mensaje de texto, archivos adjuntos. | Mensaje formateado para el agente. |
| SlideAgent | Orquesta el proceso y llama a las herramientas. | Mensaje del usuario. | Texto generado por Deepseek, imágenes generadas por Gemini, datos de la presentación. |
| Deepseek | Genera los textos para las diapositivas. | Texto de entrada (instrucciones). | Texto estructurado (títulos y contenido). |
| Gemini Image Generator | Crea imágenes a partir de descripciones. | Texto descriptivo de la imagen. | Imagen binaria. |
| Google Slides – Obtener Presentación | Obtiene la presentación base y sus IDs. | URL de la presentación. | Información de la presentación (slides, IDs). |
| Google Slides – Crear Slides | Crea una nueva presentación a partir de una plantilla. | URL de la plantilla, título. | URL de la nueva presentación. |
| Google Slides – Reemplazar Texto | Sustituye los marcadores de texto en las diapositivas. | Texto a reemplazar, contenido generado. | Resultado de la operación (estado). |
| Google Slides – Reemplazar Imagen | Sustituye las imágenes existentes por las nuevas. | URL de la imagen generada, ID del objeto a reemplazar. | Resultado de la operación (estado). |
| Google Slides – Obtener Thumbnail | Recupera los IDs de miniaturas de la presentación. | URL de la presentación. | Lista de IDs de miniaturas. |
| Chat Output | Entrega la presentación final al usuario. | Mensaje con la URL o enlace de la presentación. | Mensaje de respuesta al usuario. |
Nota: Los Label Components presentes en el diagrama solo sirven para documentación interna y no participan en la ejecución del flujo.
🧠 Notas
- El agente emplea un modelo de lenguaje Deepseek como motor principal y un generador de imágenes Gemini para el contenido visual.
- Todas las operaciones con Google Slides se realizan mediante la API
googleslidescomponent, configurada para ejecutar la acción especificada (crear, reemplazar, obtener). - La URL de la presentación resultante se pasa al usuario en la respuesta final.
- El flujo es idempotente: cada ejecución crea una nueva presentación y no modifica la original.
- Se requiere configuración previa de credenciales tanto para Deepseek como para Google Slides.
- El orden de las operaciones es crítico: la creación de la presentación debe preceder a cualquier reemplazo de texto o imagen.