Модели и расходы
Выбор модели для агента, цены, лимиты, как экономить через prompt caching
Модели и расходы
Доступные модели
На вкладке «Модель» в настройках агента — сетка моделей с ценами в вашей валюте.
Claude (Anthropic)
| Модель | Когда использовать | Стоимость* |
|---|---|---|
| Opus | Самое сложное: глубокий анализ, длинные документы, сложная логика. Дорого, но топовое качество. | Высокая |
| Sonnet | Универсальный выбор. Хороший баланс качества и цены, подходит для большинства консультантов. | Средняя |
| Haiku | Простые ответы, быстрые задачи (FAQ, типовые ответы). Самая дешёвая в линейке. | Низкая |
DeepSeek
| Модель | Когда использовать | Стоимость* |
|---|---|---|
| DeepSeek Chat | Универсальная модель, ~10× дешевле Claude Sonnet при сопоставимом качестве на базовых задачах. | Очень низкая |
| DeepSeek Reasoner | Когда нужны рассуждения, цепочки вывода, разбор сложных запросов. | Низкая |
* Конкретные цены за 1M входных/выходных токенов отображаются прямо в UI и обновляются при изменении курса USD→RUB.
Что такое токен
Токен — единица текста. Грубо: 1 токен ≈ 4 символа в английском, ≈ 2–3 символа в русском. Сообщение «Привет, как дела?» — это ~6 токенов.
При каждом запросе списываются:
- Input tokens — что отправили в модель: системный промпт + база знаний + история диалога + новое сообщение.
- Output tokens — что модель ответила. Обычно дороже input в 2–5 раз.
- Cache tokens — про них ниже.
Prompt caching — главный способ экономии
Anthropic и DeepSeek поддерживают кэширование префикса промпта: если вы повторно отправляете один и тот же стартовый блок текста (системный промпт + база знаний), модель возвращает его из кэша со скидкой ~90%.
В Framix кэш уже включён для всех агентов на Claude/DeepSeek. Ничего настраивать не надо.
Как это работает на практике:
- Первое сообщение в сессии:
cacheW(запись в кэш) > 0,cacheR= 0. Стоит чуть дороже обычного входа (×1.25). - Все последующие сообщения:
cacheR(чтение) > 0,cacheW= 0. Стоят на 90% дешевле. - Кэш живёт час — если после паузы 70 минут пользователь напишет снова, система пересоздаст кэш.
В реальности это означает: диалог из 10 сообщений обходится примерно как 2 сообщения без кэша.
Когда кэш не работает
- Если системный промпт + база знаний меньше ~1024 токенов (DeepSeek не кэширует короткие промпты, минимум для Claude — 1024).
- Если вы поменяли промпт или базу знаний — кэш сбрасывается, следующий запрос его пересоздаст.
- Для модели
bridge(Claude Code CLI fallback) — кэширование не поддерживается.
Лимиты расходов
Защита от непредвиденных трат. Настраиваются на странице агента → блок «Лимиты расходов»:
- Дневной — например, 100 ₽/день. Считается с 00:00 по Москве.
- Недельный — с понедельника по воскресенье.
- Месячный — с 1-го числа.
Можно использовать любую комбинацию или вообще не задавать (тогда расходы ограничены только балансом).
При превышении лимита API возвращает 429 с кодом daily_limit_reached / weekly_limit_reached / monthly_limit_reached. Виджет показывает посетителю «Лимит исчерпан, попробуйте позже». На следующий период лимит сбрасывается автоматически.
Где смотреть расходы
- Страница агента → «Статистика» — расходы конкретного агента (с фильтром по периоду).
- Финансы → Операции — общий список всех списаний с баланса (хостинг + ИИ + бонусы), включая график расходов по категориям.
- Финансы → AI — отдельная вкладка только с AI-операциями.
Сколько примерно стоит работа агента
Очень грубо, для среднего FAQ-бота на DeepSeek Chat:
- 1 короткий вопрос (200 in / 200 out) ≈ 0.05–0.10 ₽
- Сложный диалог (1000 in / 800 out, без кэша) ≈ 0.25–0.50 ₽
- Тот же диалог с активным кэшем (cacheR=900, in=100, out=800) ≈ 0.10–0.20 ₽
- 100 диалогов в день ≈ 5–20 ₽/день
Для Claude Sonnet — умножайте на ~10–15. Для Opus — на ~30.
Реальные цифры всегда видны в «Статистика» агента и в финансовых операциях.
Пополнение баланса
Бот тратит рубли с общего кошелька Framix — те же рубли, что используются на хостинг проектов. Пополнение — на Финансы → Пополнение, через ЮKassa, картой РФ, СБП.
При регистрации выдаётся 1000 ₽ бонуса — этого хватит, чтобы поэкспериментировать с ботом и опубликовать пару проектов.
Бридж-провайдер
Помимо публичных API, в системе есть провайдер bridge — это Claude Code CLI fallback на случай проблем с API Anthropic. Используется автоматически при сбоях, не требует отдельной настройки. Но кэширование там не поддерживается, поэтому стандартный выбор — claude или deepseek.