빌링AI
NEW

빌링AI 스마트 라우팅

하나의 모델 ID로 최적의 AI 모델이 자동으로 선택됩니다

billing-ai/auto 하나만 설정하면, 요청 유형에 따라 비용과 품질의 최적 균형점을 자동으로 찾아 라우팅합니다.

스마트 라우팅을 신뢰할 수 있는 이유

자체 구축 라우팅

독점 라우팅 엔진이 요청을 분석하고 최적 모델을 선택합니다. 외부 의존 없이 완전히 자체 개발된 기술로 운영됩니다.

비용-품질 균형

라우팅 에이전트는 무료입니다. 실제 사용한 모델만 과금되어, 항상 최적의 비용-품질 균형을 보장합니다.

투명한 모델 정보

블랙박스가 아닙니다. 응답에 실제 사용된 모델이 명시되며, 라우팅 이유와 절감액도 함께 확인할 수 있습니다.

작동 방식

요청 유형에 따라 최적의 모델이 자동으로 선택됩니다

단순 작업

번역, 요약

Gemini Flash / DeepSeek Chat 등 저렴한 모델로 라우팅

복잡한 분석

코드 생성, 논리 추론

GPT-5.4 / Claude Opus 등 고성능 모델로 라우팅

혼합 워크플로

다양한 요청 혼합

요청별로 자동 분류하여 최적 모델을 선택

요청 예제

curl -X POST https://api.billing-ai.kr/api/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "billing-ai/auto",
    "messages": [
      {
        "role": "user",
        "content": "이 문서를 요약해주세요"
      }
    ]
  }'

응답 예제 (사용된 모델 표시)

{
  "model": "gemini-2-5-flash",
  "usage": {
    "prompt_tokens": 150,
    "completion_tokens": 89
  },
  "routing": {
    "reason": "simple_task",
    "cost_saved": "67%"
  }
}

수동 선택 vs 스마트 라우팅

항목수동 선택스마트 라우팅
모델 선택직접 선택 필요자동
비용 최적화수동자동
코드 변경모델별 분기model ID 하나
품질 보장경험 의존알고리즘 기반

자주 묻는 질문

스마트 라우팅이란?

스마트 라우팅은 요청의 내용과 복잡도를 분석하여, 53개 이상의 AI 모델 중 비용과 품질 면에서 최적인 모델을 자동으로 선택하는 기능입니다. model ID를 billing-ai/auto로 설정하면 자동으로 활성화됩니다.

추가 비용이 있나요?

라우팅 자체는 무료입니다. 실제 사용된 모델의 토큰 비용만 과금되므로, 오히려 수동 선택보다 비용이 절감되는 경우가 많습니다.

어떤 모델로 라우팅되나요?

GPT-5.4, Claude Opus, Gemini, DeepSeek 등 53개 이상의 텍스트 모델 중에서 요청 유형에 따라 자동으로 최적 모델이 선택됩니다.

특정 모델을 지정할 수 있나요?

물론입니다. model ID를 직접 지정하면(예: gpt-5-4) 해당 모델이 그대로 사용됩니다. 스마트 라우팅은 billing-ai/auto를 사용할 때만 동작합니다.

응답에서 어떤 모델이 사용됐는지 알 수 있나요?

네. 응답 JSON의 model 필드에 실제 사용된 모델명이 표시되며, routing 객체에서 선택 이유와 절감액도 확인할 수 있습니다.

지금 스마트 라우팅을 시작하세요

model ID 하나로 53개 AI 모델의 최적 조합을 경험하세요.