Fluxo de captura de contatos de negócios
Busca negócios por nicho, filtra sites oficiais, extrai dados chave por meio de scraping e adiciona contatos verificados automaticamente ao Google Sheets.
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
SearXng-ntpo0[Web Search SearXng]
style SearXng-ntpo0 stroke:#a170ff
DeepseekModel-yd7iq[Deepseek]
style DeepseekModel-yd7iq stroke:#a170ff
CreateData-dfb3f[Create Data]
style CreateData-dfb3f stroke:#a170ff
Switch-56w06[Switch]
style Switch-56w06 stroke:#a170ff
WebScraper-p0rr5[Web Scraper]
style WebScraper-p0rr5 stroke:#a170ff
DeepseekModel-4gnpf[Deepseek2]
style DeepseekModel-4gnpf stroke:#a170ff
CreateData-p25ng[Create Data2]
style CreateData-p25ng stroke:#a170ff
TextInput-3uo52[<div><img alt="logo" src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>Cantidad de citios ]
style TextInput-3uo52 stroke:#a170ff
TextInput-wcn04[<div><img alt="logo" src="/_astro/type.Dy26vmDy.svg" style="height: 20px !important;width: 20px !important"/></div>Query]
style TextInput-wcn04 stroke:#a170ff
CreateData-taieq[Create Data3]
style CreateData-taieq stroke:#a170ff
Switch-44sfm[Switch2]
style Switch-44sfm stroke:#a170ff
AdvancedAgent-plvkg[Agent]
style AdvancedAgent-plvkg stroke:#a170ff
GSheetCellComponent-usi3o[Sheet Cells ]
style GSheetCellComponent-usi3o stroke:#a170ff
DeepseekModel-c77dx[Deepseek3]
style DeepseekModel-c77dx stroke:#a170ff
SearXng-ntpo0 -.- DeepseekModel-yd7iq
linkStyle 0 stroke:#a170ff
DeepseekModel-yd7iq -.- CreateData-dfb3f
linkStyle 1 stroke:#a170ff
CreateData-dfb3f -.- Switch-56w06
linkStyle 2 stroke:#a170ff
Switch-56w06 -.- WebScraper-p0rr5
linkStyle 3 stroke:#a170ff
WebScraper-p0rr5 -.- DeepseekModel-4gnpf
linkStyle 4 stroke:#a170ff
CreateData-p25ng -.- SearXng-ntpo0
linkStyle 5 stroke:#a170ff
TextInput-3uo52 -.- CreateData-p25ng
linkStyle 6 stroke:#a170ff
TextInput-wcn04 -.- CreateData-p25ng
linkStyle 7 stroke:#a170ff
DeepseekModel-4gnpf -.- CreateData-taieq
linkStyle 8 stroke:#a170ff
CreateData-taieq -.- Switch-44sfm
linkStyle 9 stroke:#a170ff
Switch-44sfm -.- AdvancedAgent-plvkg
linkStyle 10 stroke:#a170ff
GSheetCellComponent-usi3o -.- AdvancedAgent-plvkg
linkStyle 11 stroke:#a170ff
DeepseekModel-c77dx -.- AdvancedAgent-plvkg
linkStyle 12 stroke:#a170ff
🧩 Descrição Geral
O fluxo automatiza a prospecção de contatos de negócios por nicho. A partir de uma consulta e do número de sites a pesquisar, realiza buscas na web, filtra apenas sites oficiais, extrai informações essenciais (nome, descrição, telefone, e‑mail e URL) e registra os contatos validados em uma planilha do Google Sheets.
⚙️ Funcionalidades Principais
- Pesquisa Web: busca resultados de acordo com o nicho e quantidade solicitada.
- Filtragem de Sites: determina se o título da página corresponde a um negócio oficial.
- Scraping de Conteúdo: coleta o texto bruto da página oficial.
- Extração Estruturada: extrai nome, descrição, telefone, e‑mail e URL do conteúdo.
- Persistência em Google Sheets: adiciona automaticamente linhas à planilha.
- Agente de LLM: orquestra os passos e controla a interação entre os componentes.
🔄 Passos do Fluxo de Trabalho
| Nome do Componente | Papel no Fluxo | Entradas Principais | Saídas Principais |
|---|---|---|---|
| Text Input | Recebe a quantidade de sites a pesquisar. | Valor numérico inserido pelo usuário. | Mensagem contendo o número. |
| Text Input | Recebe a descrição do nicho a pesquisar. | Texto de entrada do usuário. | Mensagem contendo a query. |
| Create Data | Constrói objeto com os parâmetros de busca. | Número de sites, query de nicho. | Registro com campos campo_1_key (número) e campo_2_key (query). |
| Web Search (SearXng) | Executa a busca na web. | Registro com query e quantidade de resultados. | Dados contendo título e URL de cada resultado. |
| Deepseek | Classifica títulos como sites oficiais ou não. | Dados com título. | Texto “Sí” ou “No”. |
| Create Data | Agrupa rótulo, título e URL para a etapa de scraping. | Rótulo, título, URL. | Registro contendo os três campos. |
| Switch | Filtra registros marcados “Sí”. | Registro de site. | Registro de sites oficiais. |
| Web Scraper | Extrai o conteúdo markdown da URL. | Registro com URL. | Dados contendo o conteúdo web. |
| Deepseek | Extrai informações estruturadas do conteúdo. | Conteúdo da página. | Texto contendo nome, descrição, telefone, e‑mail e URL em formato estruturado. |
| Create Data | Estrutura os dados extraídos em campos de contato. | Texto extraído. | Registro de contato com campos nome, descrição, telefone, e‑mail e URL. |
| Switch | Filtra registros que não retornam “No”. | Registro de contato. | Registro de contatos válidos. |
| Advanced Agent | Orquestra a inserção na planilha usando Deepseek LLM e a ferramenta Google Sheets. | Registro de contato válido. | Confirmação de inserção na planilha. |
🧠 Notas
- O fluxo utiliza dois modelos Deepseek: um para classificação de títulos e outro para extração de dados.
- O componente Switch em duas etapas garante que apenas sites oficiais e dados extraídos válidos prosseguam para a próxima fase.
- A integração com Google Sheets é realizada via ferramenta
GSheetCellComponent, que recebe os campos do registro de contato. - O agente avançado utiliza um modelo Deepseek configurado com baixa temperatura (0.1) para garantir respostas consistentes e estruturadas.
- Todas as chamadas são feitas em modo batch, permitindo paralelismo de até 5 execuções.
- Se algum passo gerar saída vazia, o fluxo pula a ramificação subsequente automaticamente.