Skip to main content

Endpoint Pricing

경로: billing.seahorse.dnotitia.ai → 관리자 → Endpoint Pricing Set prices per inference endpoint. Default: 5,000 KRW / 1M tokens Inference Endpoints 에 등록된 LLM·임베딩 엔드포인트의 1M 토큰당 단가 를 설정합니다. 기본값은 5,000 KRW / 1M tokens.

헤더

요소설명
Inference Endpoints (타이틀)페이지 제목
Create신규 엔드포인트 가격 등록
Refresh목록 재조회
SearchSearch by model, provider, UUID... — 모델 검색
All Plans 드롭다운플랜별 가격 조회

컬럼 (예상 구조)

컬럼설명
Model모델 식별자 (예: anthropic/claude-opus-4.5)
Provider제공자 (anthropic, openai, qwen 등)
UUID엔드포인트 고유 ID
Input Price입력 토큰 1M 당 단가 (KRW)
Output Price출력 토큰 1M 당 단가 (KRW)
Plan적용 플랜 (또는 All Plans)
StatusActive / Inactive

운영 주의

  • 단가 변경은 변경 시점 이후 호출에 즉시 적용 됩니다. 사용자 청구액에 영향을 주므로:
    • 사전에 영향 받는 테넌트·예상 청구 변동 시뮬레이션
    • 공지 발송 후 적용 — 공지사항
    • 변경 이력 백업 (Events 감사)
  • 신규 모델 등록 시 단가 미설정 이면 기본값 (5,000 KRW / 1M) 으로 청구됩니다 — 의도치 않은 과/저 청구 방지를 위해 등록 즉시 단가 입력.
  • 모델 단가는 Billing (사용자) — 모델 가격 에 노출되므로 사용자 가격 페이지와 일관되게 유지.
가격 책정 가이드
  • 기본 모델(gpt-oss-120b 등) 은 저단가로 책정해 진입 장벽을 낮춤
  • 고급 모델(claude-opus-4.5, gpt-5.2) 은 원가 + 마진 반영
  • 임베딩 모델(qwen3-embedding-8b) 은 입력 토큰 단가만 적용 (출력 없음)
  • BM25 sparse 등 자체 운영 모델은 매우 낮은 단가로 책정

관련 문서