Agente de Apresentações no Google Slides
O fluxo automatiza por completo a criação e edição de apresentações a partir das instruções fornecidas pelo usuário.
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ChatInput-wcyi5[<div><img alt="logo" src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Input]
style ChatInput-wcyi5 stroke:#a170ff
googleslidescomponent-0l523[Reemplazar texto]
style googleslidescomponent-0l523 stroke:#a170ff
ChatOutput-jf3v6[<div><img alt="logo" src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-jf3v6 stroke:#a170ff
googleslidescomponent-pmjen[Reemplazar Imagen]
style googleslidescomponent-pmjen stroke:#a170ff
AdvancedAgent-lja6y[SlideAgent]
style AdvancedAgent-lja6y stroke:#a170ff
googleslidescomponent-o2b5l[Obtener Presentación]
style googleslidescomponent-o2b5l stroke:#a170ff
GeminiImageGenerator-9mfx6[Gemini Image Generator]
style GeminiImageGenerator-9mfx6 stroke:#a170ff
googleslidescomponent-xa0zm[Crear Slides]
style googleslidescomponent-xa0zm stroke:#a170ff
googleslidescomponent-x60d0[Obtener thumbnail]
style googleslidescomponent-x60d0 stroke:#a170ff
DeepseekModel-8gvrz[Deepseek]
style DeepseekModel-8gvrz stroke:#a170ff
googleslidescomponent-pmjen -.- AdvancedAgent-lja6y
linkStyle 0 stroke:#a170ff
googleslidescomponent-o2b5l -.- AdvancedAgent-lja6y
linkStyle 1 stroke:#a170ff
GeminiImageGenerator-9mfx6 -.- AdvancedAgent-lja6y
linkStyle 2 stroke:#a170ff
ChatInput-wcyi5 -.- AdvancedAgent-lja6y
linkStyle 3 stroke:#a170ff
AdvancedAgent-lja6y -.- ChatOutput-jf3v6
linkStyle 4 stroke:#a170ff
googleslidescomponent-0l523 -.- AdvancedAgent-lja6y
linkStyle 5 stroke:#a170ff
googleslidescomponent-xa0zm -.- AdvancedAgent-lja6y
linkStyle 6 stroke:#a170ff
googleslidescomponent-x60d0 -.- AdvancedAgent-lja6y
linkStyle 7 stroke:#a170ff
DeepseekModel-8gvrz -.- AdvancedAgent-lja6y
linkStyle 8 stroke:#a170ff
🧩 Descrição Geral
O fluxo automatiza, de maneira totalmente integrada, a criação e edição de apresentações no Google Slides a partir de instruções recebidas pelo usuário. O agente central (SlideAgent) orquestra a geração de conteúdo textual e visual, a substituição de textos e imagens nos slides, e devolve a apresentação final ao solicitante.
⚙️ Funcionalidades Principais
- Receber instruções em texto ou arquivos por meio de chat.
- Criar, buscar e manipular apresentações do Google Slides.
- Gerar e refinar conteúdo textual com o modelo Deepseek.
- Produzir imagens temáticas usando Gemini.
- Substituir textos e imagens nos slides conforme as instruções.
- Retornar a apresentação concluída ao usuário.
🔄 Passos do Fluxo de Trabalho
| Nome do Componente | Papel no Fluxo | Entradas Principais | Saídas Principais |
|---|---|---|---|
| ChatInput | Inicia a conversa recebendo a mensagem do usuário. | Texto do usuário, arquivos anexados. | Mensagem formatada para o agente. |
| AdvancedAgent | Processa a mensagem, decide quais ferramentas usar e gera a resposta final. | Mensagem do ChatInput, modelos e ferramentas conectadas. | Mensagem de resposta para o ChatOutput. |
| googleslidescomponent (Create Presentation) | Cria uma nova apresentação vazia com base em um modelo. | URL do modelo ou apresentação base. | URL da nova apresentação. |
| googleslidescomponent (Get Presentation) | Recupera detalhes da apresentação existente. | URL da apresentação. | Dados da apresentação (slides, IDs). |
| DeepseekModel | Gera ou reformula textos a serem inseridos nos slides. | Texto bruto da pesquisa ou instrução. | Texto gerado (JSON ou texto). |
| googleslidescomponent (Replace Text) | Substitui texto em um slide específico. | ID do slide, texto de busca, texto de substituição. | Confirmação de substituição. |
| GeminiImageGenerator | Cria imagens temáticas para os slides. | Prompt descrevendo a imagem desejada. | Arquivo de imagem gerado. |
| googleslidescomponent (Replace Image) | Substitui imagem existente por nova imagem gerada. | ID da imagem antiga, URL da nova imagem. | Confirmação de substituição. |
| googleslidescomponent (Get Thumbnail) | Obtém os IDs das miniaturas das páginas da apresentação. | URL da apresentação, IDs das páginas. | Lista de IDs de miniaturas. |
| ChatOutput | Exibe a resposta final ao usuário no chat. | Mensagem produzida pelo agente. | Mensagem exibida ao usuário. |
Observação: Todos os componentes do tipo googleslidescomponent compartilham o mesmo identificador de classe. O Papel no Fluxo indica a operação específica (ex.: “Replace Text”, “Create Presentation”, etc.) que diferencia cada instância.
🧠 Notas
- O SlideAgent funciona como um orquestrador; ele determina dinamicamente a sequência de chamadas de ferramenta com base na intenção do usuário.
- Os modelos Deepseek e Gemini são configurados para gerar respostas com baixa aleatoriedade (
temperature = 0.1), garantindo consistência no conteúdo gerado. - Cada operação do Google Slides exige credenciais autenticadas (
googleslidesApi). O fluxo presume que essas credenciais já foram configuradas no ambiente. - As ferramentas de replace operam em modo By Id, requerendo os IDs dos slides e objetos dentro da apresentação.
- O agente permite streaming opcional das mensagens (
stream), útil para visualização em tempo real. - Caso alguma ferramenta retorne
Noneou lista vazia, a condição Skip Branch if Empty Output impede a propagação de erros para os próximos componentes. - O fluxo está configurado para execução sequencial, mas pode ser adaptado para paralelismo ajustando o parâmetro
parallel_executionsnos componentes de lote.