Home›Tools›AI Cost Calculator

AI Model Cost Calculator — Local vs Cloud

OpenAI/Claude/Gemini API와 로컬 LLM (RTX 3090/4090/5090) 의 월 비용을 비교합니다. 본인의 토큰 사용량을 입력하면 손익분기점(break-even)이 자동 계산됩니다.

월 입력 토큰: 10M tokens(프롬프트로 보내는 양)

0.1M (가벼움)10M (적극)50M (전문가)100M+

월 출력 토큰: 3M tokens(LLM이 생성하는 양 — 보통 입력의 20-30%)

로컬 하드웨어

일일 사용 시간: 3h/day

전기요금: $0.10/kWh(한국 가정: ~$0.10)

환율: 1 USD = 1300원

로컬 — RTX 3090 (used)

초기 하드웨어 비용

$700 ≈ ₩910,000

월 전기료

$4.73 / 47 kWh

예상 출력 처리량 (Q4 모델)

45 tokens/s

월 최대 ~14.6M out tokens (현재 사용 시간 기준)

3년 총 비용 (하드웨어 + 전기)

$870

클라우드 API 월 비용 (입력 10M + 출력 3M tokens 기준)

Gemini 2.5 Flash

Google · $0.075/M in · $0.3/M out

$1.65

₩2,145/월

GPT-4o-mini

OpenAI · $0.15/M in · $0.6/M out

$3.30

₩4,290/월

DeepSeek V3 (API)

DeepSeek · $0.27/M in · $1.1/M out

$6.00

₩7,800/월

Claude Haiku 4.5

Anthropic · $0.25/M in · $1.25/M out

$6.25

₩8,125/월

Gemini 2.5 Pro

Google · $1.25/M in · $5/M out

$28

₩35,750/월

GPT-4o

OpenAI · $2.5/M in · $10/M out

$55

₩71,500/월

Claude Sonnet 4.6

Anthropic · $3/M in · $15/M out

$75

₩97,500/월

Claude Opus 4.7

Anthropic · $15/M in · $75/M out

$375

₩487,500/월

⚖️ 손익분기점 (vs 가장 싼 클라우드: Gemini 2.5 Flash)

현재 토큰 사용량 기준으로는 클라우드($1.65/월)가 로컬 전기료($4.73/월)보다 싸거나 비슷합니다. 토큰 사용량이 적으면 클라우드가 거의 항상 유리합니다.

Quick presets

📌 계산 가정과 한계

로컬 가격은 중고 또는 평균 신품 시세 기준 (지역·시점에 따라 다름)
토큰 처리량(TPS)은 8B-30B Q4_K_M 양자화 모델 기준 대략적 추정
클라우드 API 가격은 2026년 5월 기준, 자주 변동
로컬은 품질 트레이드오프 존재 — 70B 모델도 GPT-4o, Claude Opus와 비교하면 일부 작업에서 부족
로컬의 숨은 비용: 셋업 시간, 디스크 (모델 50-100GB), 냉각, 소음, 단전 위험
로컬의 장점: 프라이버시, 무제한 사용, 카운트 없음, 인터넷 없이 작동

LLM VRAM Calculator

로컬 모델 GPU 메모리 요구량 계산 — 어떤 GPU에 어떤 모델이 들어가는지

Best AI Models for RTX 3090 in 2026 — Complete Benchmark

24GB VRAM에서 실제 성능 측정 결과

Ollama vs LM Studio vs llama.cpp 비교 2026

로컬 LLM inference 엔진 선택 가이드

로컬 — RTX 3090 (used)

클라우드 API 월 비용 (입력 10M + 출력 3M tokens 기준)

⚖️ 손익분기점 (vs 가장 싼 클라우드: Gemini 2.5 Flash)

Quick presets

관련 글