Что такое RAG — Retrieval Augmented Generation
RAG (Retrieval Augmented Generation) — архитектурный паттерн, при котором языковая модель дополняется поиском по внешней базе знаний перед генерацией ответа. Это позволяет давать актуальные и точные ответы.
RAG решает ключевые проблемы языковых моделей: устаревшие знания и галлюцинации. Система работает в три этапа: 1) поиск релевантных документов по запросу пользователя, 2) добавление найденных фрагментов в контекст модели, 3) генерация ответа на основе найденной информации. Для поиска используются векторные базы данных и эмбеддинги. RAG не требует дообучения модели и может работать с любыми актуальными данными. Perplexity AI — наглядный пример RAG в действии.
Примеры использования
- •Корпоративный чат-бот, отвечающий на вопросы по внутренней документации
- •AI-поисковик, цитирующий актуальные источники из интернета
- •Помощник по продукту, использующий базу знаний и FAQ
Связанные термины
Попробуйте RAG в Stone AI
Открыть AI-чат →