Chatea con tus documentos
De un documento puedes hacerle preguntas a la IA sobre el mismo como si fuera una conversación
+2
graph TD
%%{init: {'theme': 'mc','layout': 'elk'}}%%
ChatOutput-s3yx9[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Chat Output]
style ChatOutput-s3yx9 stroke:#a170ff
ChatInput-nbeu2[<div><img src="/_astro/messages-square.BaSDmT6g.svg" style="height: 20px !important;width: 20px !important"/></div>Pregunta]
style ChatInput-nbeu2 stroke:#a170ff
GDriveFilesComponent-ield1[<div><img src="/_astro/google_drive.wKmDsV2c.svg" style="height: 20px !important;width: 20px !important"/></div>Obtener documento]
style GDriveFilesComponent-ield1 stroke:#a170ff
OpenAIEmbeddings-8lgaa[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI Embeddings]
style OpenAIEmbeddings-8lgaa stroke:#a170ff
LanguageRecursiveTextSplitter-60k4u[Separador de texto]
style LanguageRecursiveTextSplitter-60k4u stroke:#a170ff
AdvancedAgent-8vhpf[Agent]
style AdvancedAgent-8vhpf stroke:#a170ff
OpenAIModel-1ec5c[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI]
style OpenAIModel-1ec5c stroke:#a170ff
AstraDB-0wxah[Astra DB2]
style AstraDB-0wxah stroke:#a170ff
RetrieverTool-9ghrj[<div><img src="/_astro/langchain-icon.BXtvU_nA.svg" style="height: 20px !important;width: 20px !important"/></div>RetrieverTool]
style RetrieverTool-9ghrj stroke:#a170ff
AstraDB-jjmpw[Astra DB]
style AstraDB-jjmpw stroke:#a170ff
OpenAIEmbeddings-m1or6[<div><img src="/_astro/openAI.BhmuxEs3.svg" style="height: 20px !important;width: 20px !important"/></div>OpenAI Embeddings2]
style OpenAIEmbeddings-m1or6 stroke:#a170ff
GDriveFilesComponent-ield1 -.- LanguageRecursiveTextSplitter-60k4u
linkStyle 0 stroke:#a170ff
ChatInput-nbeu2 -.- AdvancedAgent-8vhpf
linkStyle 1 stroke:#a170ff
AdvancedAgent-8vhpf -.- ChatOutput-s3yx9
linkStyle 2 stroke:#a170ff
OpenAIModel-1ec5c -.- AdvancedAgent-8vhpf
linkStyle 3 stroke:#a170ff
LanguageRecursiveTextSplitter-60k4u -.- AstraDB-0wxah
linkStyle 4 stroke:#a170ff
OpenAIEmbeddings-8lgaa -.- AstraDB-0wxah
linkStyle 5 stroke:#a170ff
RetrieverTool-9ghrj -.- AdvancedAgent-8vhpf
linkStyle 6 stroke:#a170ff
AstraDB-jjmpw -.- RetrieverTool-9ghrj
linkStyle 7 stroke:#a170ff
OpenAIEmbeddings-m1or6 -.- AstraDB-jjmpw
linkStyle 8 stroke:#a170ff
Chatea con tus documentos (Chat with Your Documents)
🧩 Descripción general
Este flujo de trabajo permite a los usuarios interactuar de forma conversacional con sus documentos mediante un asistente de IA. Automatiza el proceso de recuperación y procesamiento de documentos desde Google Drive, creando una base de conocimiento consultable y permitiendo a los usuarios hacer preguntas en lenguaje natural. El agente de IA luego proporciona respuestas basadas exclusivamente en el contenido encontrado dentro de los documentos proporcionados, asegurando que las respuestas estén fundamentadas en el material fuente.
⚙️ Características principales
- Habilita una interfaz conversacional para consultar el contenido de los documentos.
- Ingiere y procesa automáticamente documentos desde Google Drive en una base de datos vectorial.
- Utiliza un agente de generación aumentada por recuperación (RAG) para encontrar información relevante antes de formular una respuesta.
- Proporciona una herramienta dedicada para que el agente busque en la base de conocimiento de documentos bajo demanda.
🔄 Pasos del flujo de trabajo
| Nombre del componente | Rol en el flujo de trabajo | Entradas clave | Salidas clave |
|---|---|---|---|
| Obtener documento | Recupera el archivo del documento objetivo desde una ubicación específica de Google Drive. | Archivo seleccionado de Google Drive. | Datos del archivo del documento. |
| Divisor de texto | Divide el documento recuperado en fragmentos de texto más pequeños y manejables para su procesamiento. | Datos del documento. | Fragmentos de datos de texto. |
| OpenAI Embeddings | Genera incrustaciones vectoriales (representaciones numéricas) para los fragmentos de texto. | Configuración del modelo de incrustación. | Modelo de incrustación. |
| Astra DB (Ingesta) | Almacena los fragmentos de texto y sus correspondientes incrustaciones vectoriales en una base de datos vectorial para crear una base de conocimiento consultable. | Fragmentos de texto y el modelo de incrustación. | Almacén vectorial poblado. |
| OpenAI Embeddings (Consulta) | Genera incrustaciones vectoriales para las consultas de los usuarios para habilitar la búsqueda semántica. | Configuración del modelo de incrustación. | Modelo de incrustación para consultas. |
| Astra DB (Recuperador) | Crea una interfaz de recuperador para buscar en la base de datos vectorial contenido relevante para la pregunta del usuario. | Modelo de incrustación y nombre de la colección. | Recuperador de documentos. |
| Herramienta de recuperación | Envuelve el recuperador de documentos en una herramienta que el agente de IA puede llamar para encontrar información. | Recuperador de documentos, nombre de la herramienta y descripción. | Herramienta de búsqueda para el agente. |
| Modelo OpenAI | Proporciona el modelo de lenguaje central que impulsa el razonamiento y la generación de respuestas del agente de IA. | Configuración del modelo (por ejemplo, GPT-4.1-mini). | Instancia del modelo de lenguaje. |
| Pregunta | Captura la pregunta en lenguaje natural del usuario para ser procesada por el flujo de trabajo. | Texto de entrada del usuario. | Mensaje formateado para el agente. |
| Agente | El agente de IA central que orquesta la respuesta. Utiliza las herramientas proporcionadas (como el recuperador) y el modelo de lenguaje para responder la pregunta del usuario basándose en los documentos. | Pregunta del usuario, modelo de lenguaje, instrucción del sistema y herramientas. | Mensaje de respuesta generado por la IA. |
| Salida del chat | Muestra la respuesta final formateada del agente de IA de vuelta al usuario en la interfaz de chat. | Mensaje de respuesta del agente. | Mensaje de chat mostrado. |
🧠 Notas
- El flujo de trabajo está diseñado para un modelo de interacción de preguntas y respuestas donde las respuestas de la IA se basan estrictamente en el contenido del documento ingerido.
- Requiere credenciales de API válidas para OpenAI (para el modelo de lenguaje y las incrustaciones) y Astra DB (para la base de datos vectorial).
- La instrucción del sistema ordena al agente que siempre use su herramienta de recuperación ("datospararesponder") para encontrar información antes de responder, evitando alucinaciones.
- La ingesta inicial del documento y el almacenamiento vectorial es un paso de configuración único; las consultas posteriores operan sobre la base de conocimiento preconstruida.