Модели и расходы
Выбор модели для агента, цены, лимиты, как экономить через prompt caching
Модели и расходы
Доступные модели
На вкладке «Модель» в настройках агента — сетка моделей с ценами в вашей валюте.
Claude (Anthropic)
| Модель | Когда использовать | Стоимость* |
|---|---|---|
| Opus | Самое сложное: глубокий анализ, длинные документы, сложная логика. Дорого, но топовое качество. | Высокая |
| Sonnet | Универсальный выбор. Хороший баланс качества и цены, подходит для большинства консультантов. | Средняя |
| Haiku | Простые ответы, быстрые задачи (FAQ, типовые ответы). Самая дешёвая в линейке. | Низкая |
DeepSeek
| Модель | Когда использовать | Стоимость* |
|---|---|---|
| DeepSeek Chat | Универсальная модель, ~10× дешевле Claude Sonnet при сопоставимом качестве на базовых задачах. | Очень низкая |
| DeepSeek Reasoner | Когда нужны рассуждения, цепочки вывода, разбор сложных запросов. | Низкая |
Другие семейства моделей
Помимо Claude и DeepSeek, в сетке моделей доступны:
| Семейство | Примеры | Когда брать |
|---|---|---|
| OpenAI | GPT-4o, GPT-4o-mini | Сильная универсальная модель (4o) и дешёвая лёгкая (4o-mini). Хорошо держит русский и мультиязычные диалоги. |
| Google Gemini | Gemini 2.5 Pro, Gemini 2.5 Flash | Pro — длинный контекст и сложные задачи, Flash — быстрый недорогой чат. |
| Meta Llama | Llama 3.x | Открытая модель, дешёвый чат-бот общего назначения. |
| Mistral | Mistral — | Компактные европейские модели, хорошо для FAQ и типовых ответов. |
| Qwen (Alibaba) | 5 моделей | Быстрые и очень дешёвые, сильны в CJK и азиатских языках. |
| Kimi / Moonshot | K2, K2.5, K2 Thinking | Длинный контекст, разумные цены, хороший «размышляющий» вариант (K2 Thinking). |
| YandexGPT | — | В планах. |
* Конкретные цены за 1M входных/выходных токенов отображаются прямо в UI возле каждой модели и автоматически обновляются при изменении курса USD→RUB. Принцип един для всех: вы платите только за фактически использованные токены, никаких подписок.
Что такое токен
Токен — единица текста. Грубо: 1 токен ≈ 4 символа в английском, ≈ 2–3 символа в русском. Сообщение «Привет, как дела?» — это ~6 токенов.
При каждом запросе списываются:
- Input tokens — что отправили в модель: системный промпт + база знаний + история диалога + новое сообщение.
- Output tokens — что модель ответила. Обычно дороже input в 2–5 раз.
- Cache tokens — про них ниже.
Prompt caching — главный способ экономии
Большинство провайдеров (Anthropic, DeepSeek, OpenAI, Google и другие) поддерживают кэширование префикса промпта: если вы повторно отправляете один и тот же стартовый блок текста (системный промпт + база знаний), модель возвращает его из кэша со скидкой ~90%.
В Framix кэш уже включён для всех агентов на моделях с поддержкой кэширования. Ничего настраивать не надо.
Как это работает на практике:
- Первое сообщение в сессии:
cacheW(запись в кэш) > 0,cacheR= 0. Стоит чуть дороже обычного входа (×1.25). - Все последующие сообщения:
cacheR(чтение) > 0,cacheW= 0. Стоят на 90% дешевле. - Кэш живёт час — если после паузы 70 минут пользователь напишет снова, система пересоздаст кэш.
В реальности это означает: диалог из 10 сообщений обходится примерно как 2 сообщения без кэша.
Когда кэш не работает
- Если системный промпт + база знаний меньше ~1024 токенов (DeepSeek не кэширует короткие промпты, минимум для Claude — 1024).
- Если вы поменяли промпт или базу знаний — кэш сбрасывается, следующий запрос его пересоздаст.
- Для модели
bridge(Claude Code CLI fallback) — кэширование не поддерживается.
Лимиты расходов
Защита от непредвиденных трат. Настраиваются на странице агента → блок «Лимиты расходов»:
- Дневной — например, 100 ₽/день. Считается с 00:00 по Москве.
- Недельный — с понедельника по воскресенье.
- Месячный — с 1-го числа.
Можно использовать любую комбинацию или вообще не задавать (тогда расходы ограничены только балансом).
При превышении лимита API возвращает 429 с кодом daily_limit_reached / weekly_limit_reached / monthly_limit_reached. Виджет показывает посетителю «Лимит исчерпан, попробуйте позже». На следующий период лимит сбрасывается автоматически.
Где смотреть расходы
- Страница агента → «Статистика» — расходы конкретного агента (с фильтром по периоду).
- Финансы → Операции — общий список всех списаний с баланса (хостинг + ИИ + бонусы), включая график расходов по категориям.
- Финансы → AI — отдельная вкладка только с AI-операциями.
Сколько примерно стоит работа агента
Очень грубо, для среднего FAQ-бота на DeepSeek Chat:
- 1 короткий вопрос (200 in / 200 out) ≈ 0.05–0.10 ₽
- Сложный диалог (1000 in / 800 out, без кэша) ≈ 0.25–0.50 ₽
- Тот же диалог с активным кэшем (cacheR=900, in=100, out=800) ≈ 0.10–0.20 ₽
- 100 диалогов в день ≈ 5–20 ₽/день
Для Claude Sonnet — умножайте на ~10–15. Для Opus — на ~30.
Реальные цифры всегда видны в «Статистика» агента и в финансовых операциях.
Пополнение баланса
Бот тратит рубли с общего кошелька Framix — те же рубли, что используются на хостинг проектов и аренду самого агента (1990 ₽/мес). Пополнение — на Финансы → Пополнение, через ЮKassa, картой РФ, СБП.
При регистрации выдаётся 100 ₽ бонуса на AI на отдельный бонусный счёт (тратится первым) — бесплатный пробник AI-генераций и агентов. Когда бонус исчерпан, чтобы продолжить пользоваться агентами по токенам — нужно пополнить баланс на сумму от 100 ₽. Первые 7 дней хостинг сайтов и агентов бесплатен (пробный период), дальше — почасовая оплата.
Подробнее: Оплата и баланс.
Бридж-провайдер
Помимо публичных API, в системе есть провайдер bridge — это Claude Code CLI fallback на случай проблем с API Anthropic. Используется автоматически при сбоях, не требует отдельной настройки. Но кэширование там не поддерживается, поэтому стандартный выбор — любая модель из общей сетки (Claude, GPT, Gemini, DeepSeek, Qwen, Kimi и т.д.).