Что такое DeepSeek — китайская AI модель

DeepSeek — серия больших языковых моделей от китайской компании DeepSeek AI. Модели отличаются высокой эффективностью и конкурентным качеством при значительно меньших затратах на обучение.

DeepSeek привлёк внимание мирового AI-сообщества, продемонстрировав результаты уровня GPT-4 при многократно меньших затратах на обучение. DeepSeek-R1 — модель с «мышлением», которая пошагово рассуждает перед ответом, что повышает точность в сложных задачах. Архитектура MoE (Mixture of Experts) позволяет модели активировать только часть параметров для каждого запроса, что снижает стоимость. DeepSeek выпускает модели с открытыми весами. Доступен в Stone AI.

Примеры использования

  • Решение сложных математических задач с пошаговым рассуждением
  • Генерация кода на уровне GPT-4 при меньшей стоимости
  • Анализ текстов на русском и китайском языках

Связанные термины

Попробуйте DeepSeek в Stone AI

Открыть AI-чат →