En la primera parte, abordamos cómo dialogar con un modelo para obtener un diálogo basado en información sobre la cual no ha sido entrenado. En nuestra segunda parte, examinamos la estrategia para crear nuestros índices y almacenarlos. En esta última parte, abordaremos, a través de un caso práctico, cómo crear un sistema RAG completo e iniciar un diálogo para dar a los usuarios la posibilidad de conversar con nuestro modelo enri...
En la primera parte, abordamos cómo interactuar con un modelo para obtener un diálogo basado en información sobre la cual no ha sido entrenado. Para resumir, añadimos al contexto la información deseada. Pero, ¿qué sucede si quisieras usar una base de conocimientos completa? Eso sería demasiada información para agregar al contexto. Por ello, necesitamos poner en una base de datos toda la información que deseamos proporcion...
Para esta primera parte de nuestra serie de artículos, vamos a basar nuestra exploración en este tutorial
para implementar un proceso RAG. Pero, ¿qué es un RAG? RAG, o "Generación Aumentada por Recuperación" (por sus siglas en inglés, "Retrieval-Augmented Generation"), es una técnica avanzada en inteligencia artificial, específicamente en el campo del procesamiento de lenguaje natural (NLP), que implica enriquecer el proceso de ...
Llama CPP es una nueva herramienta diseñada para ejecutar modelos de lenguaje directamente en C/C++. Esta herramienta está especialmente optimizada para procesadores Apple Silicon gracias al uso de la tecnología ARM NEON y del framework Accelerate.
También ofrece compatibilidad AVX2 para sistemas basados en arquitecturas x86. Funcionando principalmente en la CPU, Llama CPP también incorpora la capacidad de cuantificación de 4 bits, aumentando as&iac...