HomeToolsAI Cost Calculator

AI Model Cost Calculator — Local vs Cloud

OpenAI/Claude/Gemini API와 로컬 LLM (RTX 3090/4090/5090) 의 월 비용을 비교합니다. 본인의 토큰 사용량을 입력하면 손익분기점(break-even)이 자동 계산됩니다.

0.1M (가벼움)10M (적극)50M (전문가)100M+

로컬 — RTX 3090 (used)

초기 하드웨어 비용
$700 ≈ ₩910,000
월 전기료
$4.73 / 47 kWh
예상 출력 처리량 (Q4 모델)
45 tokens/s
월 최대 ~14.6M out tokens (현재 사용 시간 기준)
3년 총 비용 (하드웨어 + 전기)
$870

클라우드 API 월 비용 (입력 10M + 출력 3M tokens 기준)

Gemini 2.5 Flash
Google · $0.075/M in · $0.3/M out
$1.65
2,145/월
GPT-4o-mini
OpenAI · $0.15/M in · $0.6/M out
$3.30
4,290/월
DeepSeek V3 (API)
DeepSeek · $0.27/M in · $1.1/M out
$6.00
7,800/월
Claude Haiku 4.5
Anthropic · $0.25/M in · $1.25/M out
$6.25
8,125/월
Gemini 2.5 Pro
Google · $1.25/M in · $5/M out
$28
35,750/월
GPT-4o
OpenAI · $2.5/M in · $10/M out
$55
71,500/월
Claude Sonnet 4.6
Anthropic · $3/M in · $15/M out
$75
97,500/월
Claude Opus 4.7
Anthropic · $15/M in · $75/M out
$375
487,500/월

⚖️ 손익분기점 (vs 가장 싼 클라우드: Gemini 2.5 Flash)

현재 토큰 사용량 기준으로는 클라우드($1.65/월)가 로컬 전기료($4.73/월)보다 싸거나 비슷합니다. 토큰 사용량이 적으면 클라우드가 거의 항상 유리합니다.

Quick presets

📌 계산 가정과 한계

  • 로컬 가격은 중고 또는 평균 신품 시세 기준 (지역·시점에 따라 다름)
  • 토큰 처리량(TPS)은 8B-30B Q4_K_M 양자화 모델 기준 대략적 추정
  • 클라우드 API 가격은 2026년 5월 기준, 자주 변동
  • 로컬은 품질 트레이드오프 존재 — 70B 모델도 GPT-4o, Claude Opus와 비교하면 일부 작업에서 부족
  • 로컬의 숨은 비용: 셋업 시간, 디스크 (모델 50-100GB), 냉각, 소음, 단전 위험
  • 로컬의 장점: 프라이버시, 무제한 사용, 카운트 없음, 인터넷 없이 작동

관련 글