Giá được tính theo $/1M tokens, cập nhật lần cuối: 30/07/2025
Anthropic
3 model(s)
Claude Opus 4
200K
$15.00
$1.50
Save 90%
$75.00
Function CallingJSON OutputVisionArtifacts
Claude Sonnet 4
200K
$3.00
$0.30
Save 90%
$15.00
Function CallingJSON OutputVisionArtifacts
Claude Haiku 3.5
200K
$0.80
$0.08
Save 90%
$4.00
Function CallingJSON OutputVisionArtifacts
DeepSeek
2 model(s)
deepseek-chat
64K
$0.27
$0.07
Save 74%
$1.10
Function CallingJSON Output
deepseek-reasoner
64K
$0.55
$0.14
Save 75%
$2.19
Function CallingJSON OutputReasoning
Google
2 model(s)
Gemini 2.5 Flash Preview
1M
$0.15
$0.25
$3.50
Function CallingJSON OutputVisionAudioReasoningCode GenerationMultimodal
Gemini 2.5 Pro Preview
1M
$2.50
$0.63
Save 75%
$15.00
Function CallingJSON OutputVisionAudioReasoningMultimodal
OpenAI
10 model(s)
GPT-4.1
1M
$2.00
$0.50
Save 75%
$8.00
$25.00
Function CallingJSON OutputVisionAudioCode Generation
GPT-4o
128K
$2.50
$1.25
Save 50%
$10.00
Function CallingJSON OutputVisionAudioMultimodal
o3
200K
$2.00
$0.50
Save 75%
$8.00
Function CallingJSON OutputVisionAudioReasoningCode GenerationMultimodal
GPT-o4-mini
200K
$1.10
$0.28
Save 75%
$4.40
Function CallingJSON OutputVisionAudioReasoningCode GenerationMultimodal
o3-pro
200K
$20.00
$80.00
Function CallingJSON OutputVisionReasoningMultimodal
o3-mini
200K
$1.10
$0.55
Save 50%
$4.40
Function CallingJSON OutputVisionReasoningMultimodal
o1
200K
$15.00
$7.50
Save 50%
$60.00
Function CallingJSON OutputVisionReasoningMultimodal
o1-pro
200K
$150.00
$600.00
Function CallingJSON OutputVisionCode GenerationMultimodal
o1-mini
128K
$1.10
$0.55
Save 50%
$4.40
Function CallingJSON OutputVisionReasoningMultimodal
GPT-4.1 nano
1M
$0.10
$0.03
Save 70%
$0.40
Function CallingJSON Output
Tính chi phí - Model
×
Kết quả:
Chi phí Input:$0.00
Chi phí Output:$0.00
Tổng chi phí:$0.00
So sánh chi phí
Nhập số lượng tokens để so sánh chi phí giữa các model:
💡 Lưu ý quan trọng:
Giá có thể thay đổi theo chính sách nhà cung cấp
Một số model có giá khuyến mãi theo volume
Training costs chỉ áp dụng khi fine-tuning
Cache pricing giúp tiết kiệm đáng kể với context dài
📚 Giải thích thuật ngữ
Token: Là đơn vị cơ bản mà mô hình xử lý. Một token có thể là một từ, một phần của từ, hoặc một dấu câu. 1000 token tương đương khoảng 750 từ tiếng Anh. Tính toán Token ở đây
Cửa sổ ngữ cảnh (Context Window): Là lượng thông tin (tính bằng token) mà mô hình có thể ghi nhớ và xử lý trong một cuộc hội thoại.
Cached Input (Hoặc Prompt Caching): Là tính năng lưu lại các phần của prompt đã xử lý để tái sử dụng, giúp giảm chi phí cho các lệnh gọi lặp lại. `Write` là chi phí để lưu, `Read` là chi phí để đọc lại từ bộ nhớ cache.
Nguồn: Chính thức từ OpenAI, Anthropic, Google, DeepSeek và các nhà cung cấp khác