텍스트 API
OpenAI 호환 Chat Completions API. 다양한 텍스트 모델을 사용하여 대화형 응답, 코드 생성, 번역 등을 수행합니다.
엔드포인트
/api/v1/chat/completions공통 요청 파라미터
| 이름 | 타입 | 필수 | 설명 | 기본값 |
|---|---|---|---|---|
model* | string | * 필수 | 사용할 모델 ID | - |
messages* | array | * 필수 | 대화 메시지 배열. 각 메시지는 role("system" | "user" | "assistant")과 content를 포함합니다. | - |
temperature | number | 선택 | 생성 온도 (0~2). 높을수록 다양한 응답을 생성합니다. | 1.0 |
max_tokens | number | 선택 | 최대 출력 토큰 수. 모델별 상한이 다릅니다. | - |
stream | boolean | 선택 | 스트리밍 여부. true로 설정하면 토큰 단위로 실시간 전송합니다. | false |
top_p | number | 선택 | 누적 확률 샘플링. temperature와 함께 사용하지 않는 것을 권장합니다. | - |
응답 필드
| 이름 | 타입 | 필수 | 설명 | 기본값 |
|---|---|---|---|---|
id* | string | * 필수 | 응답 고유 ID | - |
object* | string | * 필수 | "chat.completion" 고정값 | - |
created* | number | * 필수 | 생성 타임스탬프 (Unix epoch) | - |
model* | string | * 필수 | 실제 사용된 모델 ID | - |
choices* | array | * 필수 | 생성 결과 배열. 각 항목에 message(role, content)와 finish_reason을 포함합니다. | - |
usage* | object | * 필수 | 토큰 사용량. prompt_tokens, completion_tokens, total_tokens를 포함합니다. | - |
코드 예제
curl -X POST https://api.billing-ai.kr/api/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5-4",
"messages": [
{"role": "system", "content": "당신은 도움이 되는 AI 어시스턴트입니다."},
{"role": "user", "content": "안녕하세요"}
],
"temperature": 0.7,
"max_tokens": 1024
}'지원 모델 (24개)
openai
anthropic
Anthropic의 최신 플래그십 모델. 100만 토큰 컨텍스트와 최고 수준의 추론 능력을 제공합니다.
입력: 6원/1K토큰, 출력: 24원/1K토큰Anthropic의 최신 균형 모델. 성능과 비용의 최적 균형을 제공합니다.
입력: 4원/1K토큰, 출력: 16원/1K토큰Anthropic의 고성능 모델. 창의적 글쓰기와 복잡한 분석에 탁월합니다.
입력: 6원/1K토큰, 출력: 24원/1K토큰Anthropic의 균형 모델. 빠른 응답과 정확한 추론을 동시에 제공합니다.
입력: 4원/1K토큰, 출력: 16원/1K토큰Anthropic의 경량 모델. 빠른 응답 속도와 비용 효율성이 특징입니다.
입력: 2원/1K토큰, 출력: 6원/1K토큰Anthropic의 프리미엄 추론 모델. 최고 수준의 정확도가 필요한 작업에 적합합니다.
입력: 18원/1K토큰, 출력: 72원/1K토큰Anthropic의 안정화 모델. 검증된 성능과 안정적인 출력을 제공합니다.
입력: 4원/1K토큰, 출력: 16원/1K토큰Google의 최신 프로 모델. 200만 토큰 컨텍스트로 대규모 문서 처리에 적합합니다.
입력: 3원/1K토큰, 출력: 10원/1K토큰Gemini 3.1 Pro의 커스텀 도구 특화 버전. 외부 도구 연동에 최적화되어 있습니다.
입력: 3원/1K토큰, 출력: 10원/1K토큰Google의 초경량 모델. 최저 비용으로 빠른 응답을 제공합니다.
입력: 1원/1K토큰, 출력: 2원/1K토큰Google의 경량 고속 모델. 빠른 응답이 필요한 실시간 서비스에 적합합니다.
입력: 1원/1K토큰, 출력: 3원/1K토큰Google의 범용 프로 모델. 균형 잡힌 성능과 긴 컨텍스트를 제공합니다.
입력: 3원/1K토큰, 출력: 10원/1K토큰Google의 이전 세대 프로 모델. 안정적인 성능과 합리적인 가격을 제공합니다.
입력: 2원/1K토큰, 출력: 6원/1K토큰Google의 경량 모델. 비용 대비 뛰어난 성능을 제공합니다.
입력: 1원/1K토큰, 출력: 2원/1K토큰Google의 최저가 모델. 단순 작업에 최적화된 초저비용 옵션입니다.
입력: 1원/1K토큰, 출력: 1원/1K토큰