Endpoint Pricing
경로:billing.seahorse.dnotitia.ai → 관리자 → Endpoint Pricing
Set prices per inference endpoint. Default: 5,000 KRW / 1M tokens
Inference Endpoints 에 등록된 LLM·임베딩 엔드포인트의 1M 토큰당 단가 를 설정합니다. 기본값은 5,000 KRW / 1M tokens.
헤더
| 요소 | 설명 |
|---|---|
| Inference Endpoints (타이틀) | 페이지 제목 |
| Create | 신규 엔드포인트 가격 등록 |
| Refresh | 목록 재조회 |
| Search | Search by model, provider, UUID... — 모델 검색 |
| All Plans 드롭다운 | 플랜별 가격 조회 |
컬럼 (예상 구조)
| 컬럼 | 설명 |
|---|---|
| Model | 모델 식별자 (예: anthropic/claude-opus-4.5) |
| Provider | 제공자 (anthropic, openai, qwen 등) |
| UUID | 엔드포인트 고유 ID |
| Input Price | 입력 토큰 1M 당 단가 (KRW) |
| Output Price | 출력 토큰 1M 당 단가 (KRW) |
| Plan | 적용 플랜 (또는 All Plans) |
| Status | Active / Inactive |
운영 주의
가격 책정 가이드
- 기본 모델(
gpt-oss-120b등) 은 저단가로 책정해 진입 장벽을 낮춤 - 고급 모델(
claude-opus-4.5,gpt-5.2) 은 원가 + 마진 반영 - 임베딩 모델(
qwen3-embedding-8b) 은 입력 토큰 단가만 적용 (출력 없음) - BM25 sparse 등 자체 운영 모델은 매우 낮은 단가로 책정
관련 문서
- Pricing Management — API 메서드별 단가
- Inference Endpoints (운영) — 엔드포인트 등록
- Billing (사용자) — 모델 가격