Модели и расходы

Выбор модели для агента, цены, лимиты, как экономить через prompt caching

Модели и расходы

Доступные модели

На вкладке «Модель» в настройках агента — сетка моделей с ценами в вашей валюте.

Claude (Anthropic)

МодельКогда использоватьСтоимость*
OpusСамое сложное: глубокий анализ, длинные документы, сложная логика. Дорого, но топовое качество.Высокая
SonnetУниверсальный выбор. Хороший баланс качества и цены, подходит для большинства консультантов.Средняя
HaikuПростые ответы, быстрые задачи (FAQ, типовые ответы). Самая дешёвая в линейке.Низкая

DeepSeek

МодельКогда использоватьСтоимость*
DeepSeek ChatУниверсальная модель, ~10× дешевле Claude Sonnet при сопоставимом качестве на базовых задачах.Очень низкая
DeepSeek ReasonerКогда нужны рассуждения, цепочки вывода, разбор сложных запросов.Низкая

* Конкретные цены за 1M входных/выходных токенов отображаются прямо в UI и обновляются при изменении курса USD→RUB.

Что такое токен

Токен — единица текста. Грубо: 1 токен ≈ 4 символа в английском, ≈ 2–3 символа в русском. Сообщение «Привет, как дела?» — это ~6 токенов.

При каждом запросе списываются:

  • Input tokens — что отправили в модель: системный промпт + база знаний + история диалога + новое сообщение.
  • Output tokens — что модель ответила. Обычно дороже input в 2–5 раз.
  • Cache tokens — про них ниже.

Prompt caching — главный способ экономии

Anthropic и DeepSeek поддерживают кэширование префикса промпта: если вы повторно отправляете один и тот же стартовый блок текста (системный промпт + база знаний), модель возвращает его из кэша со скидкой ~90%.

В Framix кэш уже включён для всех агентов на Claude/DeepSeek. Ничего настраивать не надо.

Как это работает на практике:

  1. Первое сообщение в сессии: cacheW (запись в кэш) > 0, cacheR = 0. Стоит чуть дороже обычного входа (×1.25).
  2. Все последующие сообщения: cacheR (чтение) > 0, cacheW = 0. Стоят на 90% дешевле.
  3. Кэш живёт час — если после паузы 70 минут пользователь напишет снова, система пересоздаст кэш.

В реальности это означает: диалог из 10 сообщений обходится примерно как 2 сообщения без кэша.

Когда кэш не работает

  • Если системный промпт + база знаний меньше ~1024 токенов (DeepSeek не кэширует короткие промпты, минимум для Claude — 1024).
  • Если вы поменяли промпт или базу знаний — кэш сбрасывается, следующий запрос его пересоздаст.
  • Для модели bridge (Claude Code CLI fallback) — кэширование не поддерживается.

Лимиты расходов

Защита от непредвиденных трат. Настраиваются на странице агента → блок «Лимиты расходов»:

  • Дневной — например, 100 ₽/день. Считается с 00:00 по Москве.
  • Недельный — с понедельника по воскресенье.
  • Месячный — с 1-го числа.

Можно использовать любую комбинацию или вообще не задавать (тогда расходы ограничены только балансом).

При превышении лимита API возвращает 429 с кодом daily_limit_reached / weekly_limit_reached / monthly_limit_reached. Виджет показывает посетителю «Лимит исчерпан, попробуйте позже». На следующий период лимит сбрасывается автоматически.

Где смотреть расходы

  • Страница агента → «Статистика» — расходы конкретного агента (с фильтром по периоду).
  • Финансы → Операции — общий список всех списаний с баланса (хостинг + ИИ + бонусы), включая график расходов по категориям.
  • Финансы → AI — отдельная вкладка только с AI-операциями.

Сколько примерно стоит работа агента

Очень грубо, для среднего FAQ-бота на DeepSeek Chat:

  • 1 короткий вопрос (200 in / 200 out) ≈ 0.05–0.10 ₽
  • Сложный диалог (1000 in / 800 out, без кэша) ≈ 0.25–0.50 ₽
  • Тот же диалог с активным кэшем (cacheR=900, in=100, out=800) ≈ 0.10–0.20 ₽
  • 100 диалогов в день ≈ 5–20 ₽/день

Для Claude Sonnet — умножайте на ~10–15. Для Opus — на ~30.

Реальные цифры всегда видны в «Статистика» агента и в финансовых операциях.

Пополнение баланса

Бот тратит рубли с общего кошелька Framix — те же рубли, что используются на хостинг проектов. Пополнение — на Финансы → Пополнение, через ЮKassa, картой РФ, СБП.

При регистрации выдаётся 1000 ₽ бонуса — этого хватит, чтобы поэкспериментировать с ботом и опубликовать пару проектов.

Бридж-провайдер

Помимо публичных API, в системе есть провайдер bridge — это Claude Code CLI fallback на случай проблем с API Anthropic. Используется автоматически при сбоях, не требует отдельной настройки. Но кэширование там не поддерживается, поэтому стандартный выбор — claude или deepseek.

На этой странице