Documentación del Flujo de Trabajo: Coincidencia de CV

Descripción General

Este flujo de trabajo está diseñado para ayudar a los equipos de reclutamiento a identificar al candidato más compatible dentro de un grupo de postulantes, en función de unos requisitos especificados. Toma como entrada criterios definidos por el usuario (Formación, Carrera, Experiencia, Certificados, Habilidades) y los compara con los CV de los candidatos almacenados en una base de datos vectorial. La salida final es un mensaje en formato de chat que resume el mejor emparejamiento.

Resumen de Componentes

El flujo de trabajo utiliza los siguientes componentes:

Archivo: Carga los datos de los CV de los candidatos desde archivos subidos.
CharacterTextSplitter: Divide el texto de los CV en fragmentos más pequeños para generar embeddings de forma eficiente.
OpenAIEmbeddings: Genera embeddings para los fragmentos de texto utilizando un modelo de OpenAI.
Componente Chroma VectorStore: Almacena y consulta los embeddings, permitiendo la búsqueda por similitud semántica.
Entrada de Texto: Permite que el usuario ingrese los requisitos específicos para la selección del candidato (Formación, Carrera, Experiencia, Certificados, Habilidades).
Prompt: Genera prompts basados en los datos ingresados por el usuario y la información extraída de los CV, para guiar al modelo de lenguaje.
Modelo OpenAI: Un LLM que procesa los prompts y determina el candidato más compatible.
Entrada de Chat: Facilita la interacción del usuario mediante preguntas.
Salida de Chat: Presenta la respuesta del LLM en una interfaz de chat.
Parsear Datos: Convierte los datos recuperados de la base vectorial en un formato utilizable por el prompt.

Descripción Detallada de los Componentes

CharacterTextSplitter

Descripción: Divide el texto de entrada en fragmentos más pequeños según el número de caracteres.
Parámetros de Entrada: Texto de entrada, tamaño de fragmento, solapamiento, separador.
Parámetros de Salida: Lista de fragmentos de texto.
Configuraciones Clave: chunk_size y chunk_overlap controlan el tamaño y el solapamiento de los fragmentos. El separator define el carácter o conjunto de caracteres por los cuales se divide.

OpenAIEmbeddings

Descripción: Genera embeddings para los textos de entrada usando un modelo de OpenAI.
Parámetros de Entrada: Fragmentos de texto, nombre del modelo, y otros parámetros de API.
Parámetros de Salida: Embeddings (representaciones numéricas del texto).
Configuraciones Clave: Requiere clave API de OpenAI. Se puede ajustar con diferentes parámetros para optimizar la generación de embeddings.

Componente Chroma VectorStore

Descripción: Almacena y busca embeddings usando ChromaDB.
Parámetros de Entrada: Embeddings, consulta de búsqueda.
Parámetros de Salida: Resultados de búsqueda (datos).
Configuraciones Clave: collection_name especifica la colección en ChromaDB. search_type define el tipo de búsqueda (por ejemplo: Similitud, MMR).

Entrada de Texto

Descripción: Recoge los criterios ingresados por el usuario.
Parámetros de Entrada: Ninguno.
Parámetros de Salida: Texto (entrada del usuario).
Configuraciones Clave: No tiene condiciones especiales.

Prompt

Descripción: Crea una plantilla de prompt que incorpora variables dinámicas.
Parámetros de Entrada: Requisitos definidos por el usuario.
Parámetros de Salida: Mensaje de prompt (texto).
Configuraciones Clave: La plantilla del prompt define cómo se integran los datos de entrada.

Modelo OpenAI

Descripción: Un modelo de lenguaje que genera texto basado en el prompt recibido.
Parámetros de Entrada: Prompt, nombre del modelo, otros parámetros del LLM.
Parámetros de Salida: Texto generado (respuesta del modelo).
Configuraciones Clave: Requiere clave API de OpenAI. El parámetro model_name define qué modelo se usa.

Entrada de Chat

Descripción: Acepta mensajes de chat del usuario.
Parámetros de Entrada: Ninguno.
Parámetros de Salida: Mensaje del usuario.
Configuraciones Clave: Se pueden definir metadatos como remitente e ID de conversación.

Salida de Chat

Descripción: Muestra los mensajes del modelo en la interfaz de chat.
Parámetros de Entrada: Mensaje generado por el modelo.
Parámetros de Salida: Ninguno.
Configuraciones Clave: Controla el formato y la presentación del mensaje.

Parsear Datos

Descripción: Convierte los datos en texto mediante una plantilla.
Parámetros de Entrada: Datos, plantilla.
Parámetros de Salida: Texto como mensaje.
Configuraciones Clave: La plantilla define cómo se formatea el contenido de los datos.

Ejecución del Flujo de Trabajo

Ingesta de Datos: Los CV de los candidatos se cargan utilizando el componente Archivo. Se utilizan dos instancias de este componente para permitir la carga de múltiples archivos.
División del Texto: El componente CharacterTextSplitter divide los textos de los CV en fragmentos más pequeños para su procesamiento.
Generación de Embeddings: El componente OpenAIEmbeddings genera embeddings para cada fragmento.
Almacenamiento en la Base Vectorial: Los embeddings se almacenan en Chroma VectorStore.
Entrada del Usuario y Generación de Prompt: El usuario proporciona los requisitos mediante múltiples componentes Entrada de Texto. Esta información, junto con los datos procesados de los CV, se utiliza para generar prompts a través del componente Prompt.
Procesamiento del LLM: El Modelo OpenAI procesa los prompts usando los datos de los CV recuperados mediante Chroma VectorStore y formateados por Parsear Datos.
Visualización de Resultados: El componente Salida de Chat muestra la respuesta del modelo, resumiendo el candidato más compatible según la pregunta del usuario ingresada vía Entrada de Chat.

Notas Adicionales

El rendimiento del flujo depende del tamaño de los CV y de la eficiencia tanto del modelo de embeddings como del LLM de OpenAI. Se deben asegurar cuotas de API suficientes y recursos adecuados para garantizar una ejecución óptima. La base de datos ChromaDB debe estar bien configurada para permitir almacenamiento y recuperación eficaces. Se recomienda implementar manejo de errores y registros para entornos de producción.

graph TD %%{init: {'theme': 'mc','layout': 'elk'}}%% CharacterTextSplitter-1R85m[CharacterTextSplitter] CharacterTextSplitter-1R85m@{ shape: rounded} style CharacterTextSplitter-1R85m stroke:#a170ff OpenAIEmbeddings-3krnT[<img src="/_astro/openAI.CA91HhVI.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">OpenAI Embeddings] OpenAIEmbeddings-3krnT@{ shape: rounded} style OpenAIEmbeddings-3krnT stroke:#a170ff TextInput-CFPd0[<img src="/_astro/type.Dy26vmDy.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Text Input] TextInput-CFPd0@{ shape: rounded} style TextInput-CFPd0 stroke:#a170ff TextInput-NlSki[<img src="/_astro/type.Dy26vmDy.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Text Input] TextInput-NlSki@{ shape: rounded} style TextInput-NlSki stroke:#a170ff TextInput-vORzo[<img src="/_astro/type.Dy26vmDy.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Text Input] TextInput-vORzo@{ shape: rounded} style TextInput-vORzo stroke:#a170ff TextInput-33nwM[<img src="/_astro/type.Dy26vmDy.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Text Input] TextInput-33nwM@{ shape: rounded} style TextInput-33nwM stroke:#a170ff TextInput-SAcXw[<img src="/_astro/type.Dy26vmDy.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Text Input] TextInput-SAcXw@{ shape: rounded} style TextInput-SAcXw stroke:#a170ff Prompt-s80wy[<img src="/_astro/square-terminal.BMOXc-nZ.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Prompt] Prompt-s80wy@{ shape: rounded} style Prompt-s80wy stroke:#a170ff OpenAIModel-tbutX[<img src="/_astro/openAI.CA91HhVI.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">OpenAI] OpenAIModel-tbutX@{ shape: rounded} style OpenAIModel-tbutX stroke:#a170ff ChatInput-3cw79[<img src="/_astro/messages-square.BaSDmT6g.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Chat Input] ChatInput-3cw79@{ shape: rounded} style ChatInput-3cw79 stroke:#a170ff Prompt-M9MEW[<img src="/_astro/square-terminal.BMOXc-nZ.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Prompt] Prompt-M9MEW@{ shape: rounded} style Prompt-M9MEW stroke:#a170ff ChatOutput-NwO9r[<img src="/_astro/messages-square.BaSDmT6g.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Chat Output] ChatOutput-NwO9r@{ shape: rounded} style ChatOutput-NwO9r stroke:#a170ff ParseData-CxOIq[<img src="/_astro/braces.Djq0PW4_.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Parse Data] ParseData-CxOIq@{ shape: rounded} style ParseData-CxOIq stroke:#a170ff File-Bbfze[<img src="/_astro/file-text.tXP78Pke.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">File] File-Bbfze@{ shape: rounded} style File-Bbfze stroke:#a170ff File-8soJu[<img src="/_astro/file-text.tXP78Pke.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">File] File-8soJu@{ shape: rounded} style File-8soJu stroke:#a170ff CharacterTextSplitter-FQN65[CharacterTextSplitter] CharacterTextSplitter-FQN65@{ shape: rounded} style CharacterTextSplitter-FQN65 stroke:#a170ff ChromaVectorStoreComponent-T0l0F[<img src="/_astro/chroma.Ctr3VfNN.svg" class="w-8 h-8 max-w-12 object-contain mx-auto" width="20">Chroma DB] ChromaVectorStoreComponent-T0l0F@{ shape: rounded} style ChromaVectorStoreComponent-T0l0F stroke:#a170ff TextInput-SAcXw -.- Prompt-s80wy linkStyle 0 stroke:#a170ff TextInput-CFPd0 -.- Prompt-s80wy linkStyle 1 stroke:#a170ff TextInput-vORzo -.- Prompt-s80wy linkStyle 2 stroke:#a170ff TextInput-33nwM -.- Prompt-s80wy linkStyle 3 stroke:#a170ff TextInput-NlSki -.- Prompt-s80wy linkStyle 4 stroke:#a170ff ChatInput-3cw79 -.- Prompt-M9MEW linkStyle 5 stroke:#a170ff Prompt-M9MEW -.- OpenAIModel-tbutX linkStyle 6 stroke:#a170ff OpenAIModel-tbutX -.- ChatOutput-NwO9r linkStyle 7 stroke:#a170ff ParseData-CxOIq -.- Prompt-M9MEW linkStyle 8 stroke:#a170ff File-Bbfze -.- CharacterTextSplitter-1R85m linkStyle 9 stroke:#a170ff File-8soJu -.- CharacterTextSplitter-FQN65 linkStyle 10 stroke:#a170ff OpenAIEmbeddings-3krnT -.- ChromaVectorStoreComponent-T0l0F linkStyle 11 stroke:#a170ff CharacterTextSplitter-1R85m -.- ChromaVectorStoreComponent-T0l0F linkStyle 12 stroke:#a170ff CharacterTextSplitter-FQN65 -.- ChromaVectorStoreComponent-T0l0F linkStyle 13 stroke:#a170ff Prompt-s80wy -.- ChromaVectorStoreComponent-T0l0F linkStyle 14 stroke:#a170ff ChromaVectorStoreComponent-T0l0F -.- ParseData-CxOIq linkStyle 15 stroke:#a170ff