🎬 नया — 2 मिनट का गाइड वीडियो देखें →
दस्तावेज़

BharatRouter से Claude Code को govern करें

← कुकबुक

Claude Code को अपने Claude Max plan पर चलाएँ, पर monthly limit पर कभी hard-stop न हों — BharatRouter पहले आपकी subscription इस्तेमाल करता है और अपने-आप overflow को Anthropic API पर भेज देता है, साथ ही हर कॉल metered, budgeted और residency-checked।

Max-subscription overflow → Anthropic API एजेंट मध्यम 8 min

यह gateway को Claude Code के ही आगे रखती है — BharatRouter के ज़रिए Claude इस्तेमाल करें का दूसरा आधा (जो Claude को अपने कोड से एक मॉडल के रूप में कॉल करता है)। आपके developers Claude Code वैसे ही इस्तेमाल करते रहें, जबकि उसकी हर request ₹ में metered, per-key budgets से capped, residency-checked और org के लिए logged होती है।

gateway native Anthropic Messages API (/v1/messages) serve करता है, तो Claude Code और Anthropic SDK इस पर drop-in की तरह चलते हैं। ANTHROPIC_BASE_URL को BharatRouter पर लगाएँ और अपनी br-… key एक side header पर भेजें — Claude Code Authorization को अपने Anthropic session के लिए रिज़र्व रखता है, इसलिए gateway key x-br-api-key पर जाती है।

Max limit पर काम बीच में न रुके

Claude Max plan रोज़मर्रा के ज़्यादातर Claude Code काम के लिए काफ़ी है, पर इसमें monthly usage allowance होती है। उस limit पर पहुँचते ही requests fail होने लगती हैं और session बीच काम में रुक जाता है। BharatRouter इसे ठीक करता है: यह पहले आपकी Max subscription इस्तेमाल करता है, और जैसे ही Anthropic उसे throttle करता है (HTTP 429), यह अपने-आप आपकी Anthropic API key पर fall back कर देता है, per token billed — तो काम बिना रुकावट चलता रहता है। यह TrueFoundry के subscription-priority virtual model जैसा ही है, पर एक header के रूप में, एक ऐसे gateway पर जो हर कॉल को meter, budget और residency-check भी करता है।

Claude Code को gateway पर लगाएँ

~/.claude/settings.json (या project .claude/settings.json) में यह जोड़ें। x-br-overflow: byok header subscription-first overflow चालू करता है:

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://api.bharatrouter.com",
    "ANTHROPIC_CUSTOM_HEADERS": "x-br-api-key: br-...\nx-br-overflow: byok",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "claude-opus-4-8",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "claude-sonnet-4-6",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "claude-haiku-4-5"
  }
}

Model ids में कोई पहचान-योग्य Anthropic id होनी चाहिए (claude-opus-4-8, claude-sonnet-4-6, claude-haiku-4-5) — Claude Code हर मॉडल की capabilities पहचानने के लिए id को string-match करता है।

Overflow कैसे काम करता है

Overflow के लिए दोनों credentials चाहिए। (1) Claude Code में अपने Max plan से सामान्य रूप से sign in करें — Claude Code वह session Authorization पर भेजता है, जिसे gateway आगे भेजता है। (2) spillover के लिए अपनी org की Anthropic API key एक बार BYOK में सहेजें। x-br-overflow: byok सेट होने पर gateway पहले Max session आज़माता है (margin पर मुफ़्त) और सिर्फ़ तब metered BYOK key inject करता है जब subscription 429 लौटाती है:

curl -X PUT https://api.bharatrouter.com/me/byok/anthropic \
  -H "Authorization: Bearer br-..." \
  -d '{"key": "sk-ant-...", "label": "claude-code"}'

Overflow कॉल x-br-upstream-mode: byok-overflow दिखाती हैं और किसी भी BYOK कॉल की तरह meter होती हैं, तो spillover खर्च attributed और key के ₹ budget से capped रहता है। सहेजी हुई BYOK key के बिना spill करने को कुछ नहीं — 429 सामान्य रूप से Claude Code तक चला जाता है।

तीन credential modes

1 · BYOK-inject — metered + budgeted। अपनी org की Anthropic key BYOK में सहेजें और Max session आगे न भेजें। gateway key को upstream inject करता है; Claude Code को सिर्फ़ br-… key चाहिए। हर कॉल org को metered और key के ₹ budget से capped। जब x-br-overflow सेट नहीं होता तो यही precedence है।

2 · Subscription passthrough — governed, metered नहीं। कोई key न सहेजें — Claude Code में Max से sign in करें। gateway session को बिना छेड़े आगे भेजता है और Anthropic आपकी subscription पर bill करता है। आपको routing, logging और residency gates मिलते हैं, पर subscription token-priced नहीं है, इसलिए ₹ खर्च metered नहीं होता — और यह Max limit पर hard-stop हो जाता है (इससे बचने के लिए overflow इस्तेमाल करें)।

3 · Overflow — पहले subscription, spillover पर BYOK। दोनों credentials मौजूद और x-br-overflow: byok सेट — ऊपर वाला headline mode। पहले Max, 429 पर metered API, काम कभी नहीं रुकता।

Residency और budgets

Claude एक global (US) मॉडल है। Claude Code कॉल भारत से बाहर जाती है — यह india_only को पूरा नहीं कर सकती। इस surface पर offshore को hard-block करने के लिए ANTHROPIC_CUSTOM_HEADERS में x-br-data-policy: india_only जोड़ें — gateway आगे भेजने के बजाय 403 लौटाता है। per-key ₹ budgets और daily limits BYOK-inject और overflow कॉल पर अपने-आप लागू होती हैं।

हर response में x-br-provider: anthropic और x-br-upstream-mode (byok, passthrough या byok-overflow) होता है, और हर कॉल org के usage feed में आती है — देखें Activity

Claude को अपने app से एक मॉडल के रूप में कॉल करना है? OpenAI-shaped रेसिपी इस्तेमाल करें। BR मॉडलों को एजेंट के लिए tools के रूप में देना है? MCP देखें।

और रेसिपी कुकबुक में, या पूरा API reference देखें।