Один LLM-роутер для всей команды без VPN и серых карт
Если ваш инженер открывает консоль и видит «карта отклонена», это не его проблема — это ваша инфраструктура.
Маршрутизация запросов к большим моделям — задача, в которой технические ограничения вторичны. Первичны платежи, юридический контур и привычки команды. Vibe Router — это слой, который снимает все три вопроса одним движением: один ключ, один счёт, один лог.
Что внутри роутера
Router — это шлюз, написанный на Rust. Он принимает запросы в формате, совместимом с OpenAI Chat Completions и Anthropic Messages, разбирает выбранную модель, добавляет аутентификацию провайдера и отправляет дальше. Поддерживаются:
- Claude Opus 4.7 — для длинных reasoning-сессий;
- GPT 5.2 Codex — для генерации кода в больших контекстах;
- Gemini 2.5 Pro — когда нужна мультимодальность;
- DeepSeek V4 — дешёвая лошадка для бэкграунд-задач;
- Yandex GPT — когда хочется хостинг в России на 100 %.
$ curl https://router.vibe-console.online/v1/chat/completions \
-H "Authorization: Bearer $VIBE_TOKEN" \
-H "X-Vibe-Project: payments" \
-d '{
"model": "claude-opus-4.7",
"messages": [{ "role": "user", "content": "опиши архитектуру модуля" }]
}'
Почему не «каждому свой ключ»
Подход «у каждого инженера свой OpenAI-ключ» проигрывает на четырёх фронтах: оплата в валюте, контроль расходов, отзыв доступа при увольнении и аудит. Команда в десять человек со ста ключами — это десять разных моделей биллинга и ноль агрегированных метрик.
Vibe Router решает каждый из них: оплата идёт через одного юр-лицо-плательщика, лимиты выставляются на проект или на пользователя, а если кто-то ушёл — токен инвалидируется одной командой.
POST /api/v1/tokens/revoke
{
"token_id": "tk_3f9a...",
"reason": "offboarding"
}
Биллинг в рублях, без посредников
Vibe Console показывает расход в рублях с детализацией по проекту, пользователю и модели. Никаких пересчётов «по курсу на конец месяца» — конверсия фиксируется на момент списания, а внутри одного запроса видно, сколько ушло на input, сколько на output и сколько на reasoning-токены.
«Когда финансовый отдел видит счёт в одной валюте и из одного источника, разговоры о „том самом инженере, который что-то там жжёт в Anthropic“ заканчиваются».
Лимиты по проекту, неделе и часу
Лимиты ставятся каскадом. Глобальный кап на компанию, кап на проект, кап на пользователя — и сверху часовой rate-limit, чтобы случайный while true; do vibe-codex ... в CI не съел квартальный бюджет за выходные.
# лимит проекта payments
project: payments
limits:
monthly_rub: 200000
weekly_rub: 60000
hourly_rub: 5000
per_user_daily_rub: 4000
Failover между моделями
Router читает заголовок X-Vibe-Fallback и при ошибке у первичного провайдера сам переключается на запасной. Поэтому Claude Opus 4.7 c фолбэком на DeepSeek V4 — это уже не «у нас даун», а строка в конфиге.
X-Vibe-Fallback: claude-opus-4.7,gpt-5.2-codex,deepseek-v4
Никакого VPN
Главный приз — нулевая зависимость от обходных решений. Инженеру не нужно поднимать tunnel, у DevOps не болит голова про exit-ноды, а у безопасников нет конфликта с политикой по геоблокировкам. Запросы выходят в провайдерские API из инфраструктуры роутера, а до неё доходят по обычному HTTPS.
Это не «удобство». Это снятие класса рисков: бухгалтерия закрывает закрывающие документы в рублях, ИБ закрывает аудит-чек-лист, а инженер просто делает vibe-codex и работает.
Готов попробовать?
brew tap xrouter-chat/tap && brew install vibe-codex — и за 30 секунд ты в деле.
Поставить Vibe Codex →