Что такое RAG — Retrieval Augmented Generation

RAG (Retrieval Augmented Generation) — архитектурный паттерн, при котором языковая модель дополняется поиском по внешней базе знаний перед генерацией ответа. Это позволяет давать актуальные и точные ответы.

RAG решает ключевые проблемы языковых моделей: устаревшие знания и галлюцинации. Система работает в три этапа: 1) поиск релевантных документов по запросу пользователя, 2) добавление найденных фрагментов в контекст модели, 3) генерация ответа на основе найденной информации. Для поиска используются векторные базы данных и эмбеддинги. RAG не требует дообучения модели и может работать с любыми актуальными данными. Perplexity AI — наглядный пример RAG в действии.

Примеры использования

  • Корпоративный чат-бот, отвечающий на вопросы по внутренней документации
  • AI-поисковик, цитирующий актуальные источники из интернета
  • Помощник по продукту, использующий базу знаний и FAQ

Попробуйте RAG в Stone AI

Открыть AI-чат →