텍스트 API

OpenAI 호환 Chat Completions API. 다양한 텍스트 모델을 사용하여 대화형 응답, 코드 생성, 번역 등을 수행합니다.

엔드포인트

POST/api/v1/chat/completions

공통 요청 파라미터

이름	타입	필수	설명	기본값
`model`*	string	* 필수	사용할 모델 ID	-
`messages`*	array	* 필수	대화 메시지 배열. 각 메시지는 role("system" \| "user" \| "assistant")과 content를 포함합니다.	-
`temperature`	number	선택	생성 온도 (0~2). 높을수록 다양한 응답을 생성합니다.	`1.0`
`max_tokens`	number	선택	최대 출력 토큰 수. 모델별 상한이 다릅니다.	-
`stream`	boolean	선택	스트리밍 여부. true로 설정하면 토큰 단위로 실시간 전송합니다.	`false`
`top_p`	number	선택	누적 확률 샘플링. temperature와 함께 사용하지 않는 것을 권장합니다.	-

응답 필드

이름	타입	필수	설명	기본값
`id`*	string	* 필수	응답 고유 ID	-
`object`*	string	* 필수	"chat.completion" 고정값	-
`created`*	number	* 필수	생성 타임스탬프 (Unix epoch)	-
`model`*	string	* 필수	실제 사용된 모델 ID	-
`choices`*	array	* 필수	생성 결과 배열. 각 항목에 message(role, content)와 finish_reason을 포함합니다.	-
`usage`*	object	* 필수	토큰 사용량. prompt_tokens, completion_tokens, total_tokens를 포함합니다.	-

코드 예제

curl -X POST https://api.billing-ai.kr/api/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5-4",
    "messages": [
      {"role": "system", "content": "당신은 도움이 되는 AI 어시스턴트입니다."},
      {"role": "user", "content": "안녕하세요"}
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'

지원 모델 (24개)

openai

OpenAI의 최신 플래그십 모델. 뛰어난 추론 능력과 멀티모달 처리를 제공합니다.

입력: 3원/1K토큰, 출력: 12원/1K토큰

GPT-5.4의 이전 버전. 안정적인 성능과 합리적인 비용을 제공합니다.

입력: 2원/1K토큰, 출력: 8원/1K토큰

GPT-5 시리즈의 경량 모델. 비용 효율적이면서도 높은 성능을 유지합니다.

입력: 2원/1K토큰, 출력: 6원/1K토큰

anthropic

Claude Opus 4.6

Anthropic의 최신 플래그십 모델. 100만 토큰 컨텍스트와 최고 수준의 추론 능력을 제공합니다.

입력: 6원/1K토큰, 출력: 24원/1K토큰

Claude Sonnet 4.6

Anthropic의 최신 균형 모델. 성능과 비용의 최적 균형을 제공합니다.

입력: 4원/1K토큰, 출력: 16원/1K토큰

Claude Opus 4.5

Anthropic의 고성능 모델. 창의적 글쓰기와 복잡한 분석에 탁월합니다.

입력: 6원/1K토큰, 출력: 24원/1K토큰

Claude Sonnet 4.5

Anthropic의 균형 모델. 빠른 응답과 정확한 추론을 동시에 제공합니다.

입력: 4원/1K토큰, 출력: 16원/1K토큰

Claude Haiku 4.5

Anthropic의 경량 모델. 빠른 응답 속도와 비용 효율성이 특징입니다.

입력: 2원/1K토큰, 출력: 6원/1K토큰

Claude Opus 4.1

Anthropic의 프리미엄 추론 모델. 최고 수준의 정확도가 필요한 작업에 적합합니다.

입력: 18원/1K토큰, 출력: 72원/1K토큰

Claude Sonnet 4.0

Anthropic의 안정화 모델. 검증된 성능과 안정적인 출력을 제공합니다.

입력: 4원/1K토큰, 출력: 16원/1K토큰

google

Google의 최신 프로 모델. 200만 토큰 컨텍스트로 대규모 문서 처리에 적합합니다.

입력: 3원/1K토큰, 출력: 10원/1K토큰

Gemini 3.1 Pro CustomTools

Gemini 3.1 Pro의 커스텀 도구 특화 버전. 외부 도구 연동에 최적화되어 있습니다.

입력: 3원/1K토큰, 출력: 10원/1K토큰

Gemini 3.1 Flash Lite

Google의 초경량 모델. 최저 비용으로 빠른 응답을 제공합니다.

입력: 1원/1K토큰, 출력: 2원/1K토큰

Google의 경량 고속 모델. 빠른 응답이 필요한 실시간 서비스에 적합합니다.

입력: 1원/1K토큰, 출력: 3원/1K토큰

Google의 범용 프로 모델. 균형 잡힌 성능과 긴 컨텍스트를 제공합니다.

입력: 3원/1K토큰, 출력: 10원/1K토큰

Google의 이전 세대 프로 모델. 안정적인 성능과 합리적인 가격을 제공합니다.

입력: 2원/1K토큰, 출력: 6원/1K토큰

Gemini 2.5 Flash

Google의 경량 모델. 비용 대비 뛰어난 성능을 제공합니다.

입력: 1원/1K토큰, 출력: 2원/1K토큰

Gemini 2.5 Flash Lite

Google의 최저가 모델. 단순 작업에 최적화된 초저비용 옵션입니다.

입력: 1원/1K토큰, 출력: 1원/1K토큰

deepseek

DeepSeek의 최신 모델. 얼리 액세스 단계로 강력한 추론 능력을 제공합니다.

입력: 2원/1K토큰, 출력: 8원/1K토큰

DeepSeek의 대화 최적화 모델. 자연스러운 대화와 빠른 응답을 제공합니다.

입력: 1원/1K토큰, 출력: 3원/1K토큰

DeepSeek Reasoner

DeepSeek의 추론 특화 모델. 수학, 논리, 코딩 문제 해결에 강점을 보입니다.

입력: 1원/1K토큰, 출력: 3원/1K토큰

byteplus

Doubao Seed 2.0

BytePlus의 범용 언어 모델. 다국어 지원과 비용 효율성이 특징입니다.

입력: 1원/1K토큰, 출력: 4원/1K토큰

minimax

MiniMax의 최신 텍스트 모델. 초저비용으로 기본적인 텍스트 생성을 제공합니다.

입력: 1원/1K토큰, 출력: 2원/1K토큰

moonshot

Kimi K2 Thinking

Moonshot의 사고 모델. 단계별 추론 과정을 투명하게 보여주며 복잡한 문제를 해결합니다.

입력: 1원/1K토큰, 출력: 4원/1K토큰