Mejorando RAG en español: probando los nuevos embeddings de Mistral

Qué cambió

Mistral lanzó nuevos modelos de embeddings optimizados para tareas de recuperación (RAG), con mejoras específicas en idiomas distintos al inglés, incluyendo español y portugués.

Esto es relevante porque la mayoría de sistemas de búsqueda y RAG en producción todavía sufren degradación significativa cuando trabajan con contenido en español.

Por qué importa

Los embeddings son la base de cualquier sistema RAG.

Si el modelo no representa correctamente el significado del texto en español:

  • los resultados de búsqueda empeoran
  • aumenta el ruido
  • disminuye la relevancia

Con mejores embeddings, no necesitas cambiar tu arquitectura, pero sí puedes mejorar drásticamente los resultados.

Cómo probarlos en la práctica

1. Instalar dependencias

npm install @mistralai/mistralai

2. Generar embeddings

import { Mistral } from '@mistralai/mistralai'

const client = new Mistral({ apiKey: process.env.MISTRAL_API_KEY })

const response = await client.embeddings.create({
  model: "mistral-embed",
  input: "Cómo implementar autenticación en una API REST"
})

console.log(response.data[0].embedding)

3. Almacenarlos en tu vector DB

Puedes usar:

  • PostgreSQL + pgvector
  • Pinecone
  • Weaviate
  • Redis

Ejemplo con pgvector:

INSERT INTO documents (content, embedding)
VALUES ('Cómo implementar autenticación en una API REST', '[...]');

Caso práctico: búsqueda en español

Sin embeddings optimizados, una query como:

“login seguro en API”

puede no recuperar documentos relevantes si están escritos como:

“autenticación en servicios REST”

Con embeddings mejores, la similitud semántica mejora y el sistema entiende que ambos conceptos están relacionados.

Casos de uso reales

1. Soporte al cliente

  • Búsqueda en base de conocimiento
  • FAQs en español

2. Documentación interna

  • Wikis técnicas
  • Manuales de procesos

3. Productos SaaS

  • Búsqueda dentro de apps
  • asistentes internos

Ventajas

  • Mejor recuperación en español y portugués
  • Menos necesidad de fine-tuning
  • Integración directa con pipelines existentes

Limitaciones

  • Sigue siendo necesario limpiar datos
  • Dependencia de API
  • Costos si se escala

Cuándo usar esto

Tiene sentido si:

  • tu producto está en español
  • estás construyendo RAG
  • tienes problemas de relevancia

No es necesario si:

  • trabajas solo en inglés
  • no usas búsqueda semántica

Conclusión

La mayoría de equipos no tienen un problema de arquitectura en sus sistemas RAG.

Tienen un problema de embeddings.

Y en LATAM, ese problema es aún mayor.

Mejorar esa capa puede ser el cambio más simple con mayor impacto en tus resultados.