Главная  /  Статьи  /  Infra

Один LLM-роутер для всей команды без VPN и серых карт

Если ваш инженер открывает консоль и видит «карта отклонена», это не его проблема — это ваша инфраструктура.

Маршрутизация запросов к большим моделям — задача, в которой технические ограничения вторичны. Первичны платежи, юридический контур и привычки команды. Vibe Router — это слой, который снимает все три вопроса одним движением: один ключ, один счёт, один лог.

Что внутри роутера

Router — это шлюз, написанный на Rust. Он принимает запросы в формате, совместимом с OpenAI Chat Completions и Anthropic Messages, разбирает выбранную модель, добавляет аутентификацию провайдера и отправляет дальше. Поддерживаются:

$ curl https://router.vibe-console.online/v1/chat/completions \
  -H "Authorization: Bearer $VIBE_TOKEN" \
  -H "X-Vibe-Project: payments" \
  -d '{
    "model": "claude-opus-4.7",
    "messages": [{ "role": "user", "content": "опиши архитектуру модуля" }]
  }'

Почему не «каждому свой ключ»

Подход «у каждого инженера свой OpenAI-ключ» проигрывает на четырёх фронтах: оплата в валюте, контроль расходов, отзыв доступа при увольнении и аудит. Команда в десять человек со ста ключами — это десять разных моделей биллинга и ноль агрегированных метрик.

Vibe Router решает каждый из них: оплата идёт через одного юр-лицо-плательщика, лимиты выставляются на проект или на пользователя, а если кто-то ушёл — токен инвалидируется одной командой.

POST /api/v1/tokens/revoke
{
  "token_id": "tk_3f9a...",
  "reason":   "offboarding"
}

Биллинг в рублях, без посредников

Vibe Console показывает расход в рублях с детализацией по проекту, пользователю и модели. Никаких пересчётов «по курсу на конец месяца» — конверсия фиксируется на момент списания, а внутри одного запроса видно, сколько ушло на input, сколько на output и сколько на reasoning-токены.

«Когда финансовый отдел видит счёт в одной валюте и из одного источника, разговоры о „том самом инженере, который что-то там жжёт в Anthropic“ заканчиваются».

Лимиты по проекту, неделе и часу

Лимиты ставятся каскадом. Глобальный кап на компанию, кап на проект, кап на пользователя — и сверху часовой rate-limit, чтобы случайный while true; do vibe-codex ... в CI не съел квартальный бюджет за выходные.

# лимит проекта payments
project: payments
limits:
  monthly_rub: 200000
  weekly_rub:  60000
  hourly_rub:  5000
  per_user_daily_rub: 4000

Failover между моделями

Router читает заголовок X-Vibe-Fallback и при ошибке у первичного провайдера сам переключается на запасной. Поэтому Claude Opus 4.7 c фолбэком на DeepSeek V4 — это уже не «у нас даун», а строка в конфиге.

X-Vibe-Fallback: claude-opus-4.7,gpt-5.2-codex,deepseek-v4

Никакого VPN

Главный приз — нулевая зависимость от обходных решений. Инженеру не нужно поднимать tunnel, у DevOps не болит голова про exit-ноды, а у безопасников нет конфликта с политикой по геоблокировкам. Запросы выходят в провайдерские API из инфраструктуры роутера, а до неё доходят по обычному HTTPS.

Это не «удобство». Это снятие класса рисков: бухгалтерия закрывает закрывающие документы в рублях, ИБ закрывает аудит-чек-лист, а инженер просто делает vibe-codex и работает.

Готов попробовать?

brew tap xrouter-chat/tap && brew install vibe-codex — и за 30 секунд ты в деле.

Поставить Vibe Codex →