Модели и расходы

Выбор тира модели для агента, цены, лимиты, как экономить через prompt caching

Модели и расходы

Выбор тира качества

На вкладке «Модель» в настройках агента — три карточки:

Тир	Для каких задач	Стоимость
Быстрая	Простые консультации, FAQ, большой поток сообщений	Низкая
Умная	Сложные диалоги, нестандартные вопросы, продажи	Средняя
Максимальная	Самые требовательные задачи, длинные документы, сложная логика	Высокая

Framix подбирает конкретную модель под каждый тир и обновляет её при выходе более сильных вариантов — вам не нужно следить за рынком LLM. Вы просто выбираете «Умная», и агент всегда будет на актуальной умной модели.

Для большинства задач хватает «Быстрой» или «Умной». «Максимальная» — если ваш агент разбирает сложные технические вопросы или ведёт длинные переговорные диалоги.

Конкретные цены на сообщение отображаются в UI автоматически и пересчитываются при изменении курса USD→RUB.

Что такое токен

Токен — единица текста. Грубо: 1 токен ≈ 4 символа в английском, ≈ 2–3 символа в русском. Сообщение «Привет, как дела?» — это ~6 токенов.

При каждом запросе списываются:

Input tokens — что отправили в модель: системный промпт + база знаний + история диалога + новое сообщение.
Output tokens — что модель ответила. Обычно дороже input в 2–5 раз.
Cache tokens — про них ниже.

Prompt caching — главный способ экономии

Большинство провайдеров (Anthropic, DeepSeek, OpenAI, Google и другие) поддерживают кэширование префикса промпта: если вы повторно отправляете один и тот же стартовый блок текста (системный промпт + база знаний), модель возвращает его из кэша со скидкой ~90%.

В Framix кэш уже включён для всех агентов на моделях с поддержкой кэширования. Ничего настраивать не надо.

Как это работает на практике:

Первое сообщение в сессии: cacheW (запись в кэш) > 0, cacheR = 0. Стоит чуть дороже обычного входа (×1.25).
Все последующие сообщения: cacheR (чтение) > 0, cacheW = 0. Стоят на 90% дешевле.
Кэш живёт час — если после паузы 70 минут пользователь напишет снова, система пересоздаст кэш.

В реальности это означает: диалог из 10 сообщений обходится примерно как 2 сообщения без кэша.

Когда кэш не работает

Если системный промпт + база знаний меньше ~1024 токенов (DeepSeek не кэширует короткие промпты, минимум для Claude — 1024).
Если вы поменяли промпт или базу знаний — кэш сбрасывается, следующий запрос его пересоздаст.
Для модели bridge (Claude Code CLI fallback) — кэширование не поддерживается.

Лимиты расходов

Защита от непредвиденных трат. Настраиваются на странице агента → блок «Лимиты расходов»:

Дневной — например, 100 ₽/день. Считается с 00:00 по Москве.
Недельный — с понедельника по воскресенье.
Месячный — с 1-го числа.

Можно использовать любую комбинацию или вообще не задавать (тогда расходы ограничены только балансом).

При превышении лимита API возвращает 429 с кодом daily_limit_reached / weekly_limit_reached / monthly_limit_reached. Виджет показывает посетителю «Лимит исчерпан, попробуйте позже». На следующий период лимит сбрасывается автоматически.

Где смотреть расходы

Страница агента → «Статистика» — расходы конкретного агента (с фильтром по периоду).
Финансы → Операции — общий список всех списаний с баланса (хостинг + ИИ + бонусы), включая график расходов по категориям.
Финансы → AI — отдельная вкладка только с AI-операциями.

Сколько примерно стоит работа агента

Очень грубо, для среднего FAQ-агента на тире «Быстрая»:

1 короткий вопрос ≈ 0.05–0.10 ₽
Сложный диалог (без кэша) ≈ 0.25–0.50 ₽
Тот же диалог с активным кэшем ≈ 0.10–0.20 ₽
100 диалогов в день ≈ 5–20 ₽/день

На тире «Умная» — примерно в 3–5 раз дороже. На «Максимальной» — в 10–15 раз.

Реальные цифры всегда видны в «Статистика» агента и в финансовых операциях.

Пополнение баланса

Отдельной платы за бота нет — он входит в тарифный план группы. Оплачивается только AI, и сначала он списывается с AI-кредита плана (300 / 1 000 / 3 000 ₽ в месяц на «Бизнесе» / «Профи» / «Энтерпрайзе»). Когда кредит исчерпан — тратится бонусный счёт, затем кошелёк. Пополнение кошелька — на Финансы → Пополнение, через ЮKassa, картой РФ, СБП.

При регистрации выдаётся 100 ₽ бонуса на AI на отдельный бонусный счёт — пробник AI-генераций и ботов. Новым аккаунтам вдобавок открывается пробный период на плане «Профи» с его AI-кредитом. Когда закончатся и кредит, и бонус — нужно пополнить кошелёк.

Подробнее: Тарифы и оплата.

Prompt caching сокращает расходы автоматически

Большинство провайдеров, стоящих за тирами Framix, поддерживают кэширование префикса промпта: если системный промпт + база знаний не изменились, повторные запросы обрабатываются со скидкой ~90%.

В Framix кэш включён автоматически для всех агентов. В диалоге из 10 сообщений вы платите примерно как за 2 сообщения без кэша.

Подробнее о cache-токенах — в разделе «Разбивка токенов» вкладки «Статистика» агента.

Назад API агентаИнтеграция агента в мобильные приложения, Telegram-боты и любые внешние системы через REST + SSE Дальше Захват лидов и CRMАвтоматический захват email и телефона из диалогов, создание лидов в CRM, webhook на внешние системы