Модели и расходы

Выбор модели для агента, цены, лимиты, как экономить через prompt caching

Модели и расходы

Доступные модели

На вкладке «Модель» в настройках агента — сетка моделей с ценами в вашей валюте.

Claude (Anthropic)

МодельКогда использоватьСтоимость*
OpusСамое сложное: глубокий анализ, длинные документы, сложная логика. Дорого, но топовое качество.Высокая
SonnetУниверсальный выбор. Хороший баланс качества и цены, подходит для большинства консультантов.Средняя
HaikuПростые ответы, быстрые задачи (FAQ, типовые ответы). Самая дешёвая в линейке.Низкая

DeepSeek

МодельКогда использоватьСтоимость*
DeepSeek ChatУниверсальная модель, ~10× дешевле Claude Sonnet при сопоставимом качестве на базовых задачах.Очень низкая
DeepSeek ReasonerКогда нужны рассуждения, цепочки вывода, разбор сложных запросов.Низкая

Другие семейства моделей

Помимо Claude и DeepSeek, в сетке моделей доступны:

СемействоПримерыКогда брать
OpenAIGPT-4o, GPT-4o-miniСильная универсальная модель (4o) и дешёвая лёгкая (4o-mini). Хорошо держит русский и мультиязычные диалоги.
Google GeminiGemini 2.5 Pro, Gemini 2.5 FlashPro — длинный контекст и сложные задачи, Flash — быстрый недорогой чат.
Meta LlamaLlama 3.xОткрытая модель, дешёвый чат-бот общего назначения.
MistralMistral —Компактные европейские модели, хорошо для FAQ и типовых ответов.
Qwen (Alibaba)5 моделейБыстрые и очень дешёвые, сильны в CJK и азиатских языках.
Kimi / MoonshotK2, K2.5, K2 ThinkingДлинный контекст, разумные цены, хороший «размышляющий» вариант (K2 Thinking).
YandexGPTВ планах.

* Конкретные цены за 1M входных/выходных токенов отображаются прямо в UI возле каждой модели и автоматически обновляются при изменении курса USD→RUB. Принцип един для всех: вы платите только за фактически использованные токены, никаких подписок.

Что такое токен

Токен — единица текста. Грубо: 1 токен ≈ 4 символа в английском, ≈ 2–3 символа в русском. Сообщение «Привет, как дела?» — это ~6 токенов.

При каждом запросе списываются:

  • Input tokens — что отправили в модель: системный промпт + база знаний + история диалога + новое сообщение.
  • Output tokens — что модель ответила. Обычно дороже input в 2–5 раз.
  • Cache tokens — про них ниже.

Prompt caching — главный способ экономии

Большинство провайдеров (Anthropic, DeepSeek, OpenAI, Google и другие) поддерживают кэширование префикса промпта: если вы повторно отправляете один и тот же стартовый блок текста (системный промпт + база знаний), модель возвращает его из кэша со скидкой ~90%.

В Framix кэш уже включён для всех агентов на моделях с поддержкой кэширования. Ничего настраивать не надо.

Как это работает на практике:

  1. Первое сообщение в сессии: cacheW (запись в кэш) > 0, cacheR = 0. Стоит чуть дороже обычного входа (×1.25).
  2. Все последующие сообщения: cacheR (чтение) > 0, cacheW = 0. Стоят на 90% дешевле.
  3. Кэш живёт час — если после паузы 70 минут пользователь напишет снова, система пересоздаст кэш.

В реальности это означает: диалог из 10 сообщений обходится примерно как 2 сообщения без кэша.

Когда кэш не работает

  • Если системный промпт + база знаний меньше ~1024 токенов (DeepSeek не кэширует короткие промпты, минимум для Claude — 1024).
  • Если вы поменяли промпт или базу знаний — кэш сбрасывается, следующий запрос его пересоздаст.
  • Для модели bridge (Claude Code CLI fallback) — кэширование не поддерживается.

Лимиты расходов

Защита от непредвиденных трат. Настраиваются на странице агента → блок «Лимиты расходов»:

  • Дневной — например, 100 ₽/день. Считается с 00:00 по Москве.
  • Недельный — с понедельника по воскресенье.
  • Месячный — с 1-го числа.

Можно использовать любую комбинацию или вообще не задавать (тогда расходы ограничены только балансом).

При превышении лимита API возвращает 429 с кодом daily_limit_reached / weekly_limit_reached / monthly_limit_reached. Виджет показывает посетителю «Лимит исчерпан, попробуйте позже». На следующий период лимит сбрасывается автоматически.

Где смотреть расходы

  • Страница агента → «Статистика» — расходы конкретного агента (с фильтром по периоду).
  • Финансы → Операции — общий список всех списаний с баланса (хостинг + ИИ + бонусы), включая график расходов по категориям.
  • Финансы → AI — отдельная вкладка только с AI-операциями.

Сколько примерно стоит работа агента

Очень грубо, для среднего FAQ-бота на DeepSeek Chat:

  • 1 короткий вопрос (200 in / 200 out) ≈ 0.05–0.10 ₽
  • Сложный диалог (1000 in / 800 out, без кэша) ≈ 0.25–0.50 ₽
  • Тот же диалог с активным кэшем (cacheR=900, in=100, out=800) ≈ 0.10–0.20 ₽
  • 100 диалогов в день ≈ 5–20 ₽/день

Для Claude Sonnet — умножайте на ~10–15. Для Opus — на ~30.

Реальные цифры всегда видны в «Статистика» агента и в финансовых операциях.

Пополнение баланса

Бот тратит рубли с общего кошелька Framix — те же рубли, что используются на хостинг проектов и аренду самого агента (1990 ₽/мес). Пополнение — на Финансы → Пополнение, через ЮKassa, картой РФ, СБП.

При регистрации выдаётся 100 ₽ бонуса на AI на отдельный бонусный счёт (тратится первым) — бесплатный пробник AI-генераций и агентов. Когда бонус исчерпан, чтобы продолжить пользоваться агентами по токенам — нужно пополнить баланс на сумму от 100 ₽. Первые 7 дней хостинг сайтов и агентов бесплатен (пробный период), дальше — почасовая оплата.

Подробнее: Оплата и баланс.

Бридж-провайдер

Помимо публичных API, в системе есть провайдер bridge — это Claude Code CLI fallback на случай проблем с API Anthropic. Используется автоматически при сбоях, не требует отдельной настройки. Но кэширование там не поддерживается, поэтому стандартный выбор — любая модель из общей сетки (Claude, GPT, Gemini, DeepSeek, Qwen, Kimi и т.д.).

На этой странице