So sánh giá API của các nhà cung cấp AI
Giá được tính theo $/1M tokens, cập nhật lần cuối: 15/06/2025

Anthropic
3 model(s)
Claude Opus 4
200K
$15.00
$1.50
Save 90%
$75.00
Function Calling
JSON Output
Vision
Artifacts
Claude Sonnet 4
200K
$3.00
$0.30
Save 90%
$15.00
Function Calling
JSON Output
Vision
Artifacts
Claude Haiku 3.5
200K
$0.80
$0.08
Save 90%
$4.00
Function Calling
JSON Output
Vision
Artifacts

DeepSeek
2 model(s)
deepseek-chat
64K
$0.27
$0.07
Save 74%
$1.10
Function Calling
JSON Output
deepseek-reasoner
64K
$0.55
$0.14
Save 75%
$2.19
Function Calling
JSON Output
Reasoning

2 model(s)
Gemini 2.5 Flash Preview
1M
$0.15
$0.25
$3.50
Function Calling
JSON Output
Vision
Audio
Reasoning
Code Generation
Multimodal
Gemini 2.5 Pro Preview
1M
$2.50
$0.63
Save 75%
$15.00
Function Calling
JSON Output
Vision
Audio
Reasoning
Multimodal

OpenAI
10 model(s)
GPT-4.1
1M
$2.00
$0.50
Save 75%
$8.00
$25.00
Function Calling
JSON Output
Vision
Audio
Code Generation
GPT-4o
128K
$2.50
$1.25
Save 50%
$10.00
Function Calling
JSON Output
Vision
Audio
Multimodal
o3
200K
$2.00
$0.50
Save 75%
$8.00
Function Calling
JSON Output
Vision
Audio
Reasoning
Code Generation
Multimodal
GPT-o4-mini
200K
$1.10
$0.28
Save 75%
$4.40
Function Calling
JSON Output
Vision
Audio
Reasoning
Code Generation
Multimodal
o3-pro
200K
$20.00
$80.00
Function Calling
JSON Output
Vision
Reasoning
Multimodal
o3-mini
200K
$1.10
$0.55
Save 50%
$4.40
Function Calling
JSON Output
Vision
Reasoning
Multimodal
o1
200K
$15.00
$7.50
Save 50%
$60.00
Function Calling
JSON Output
Vision
Reasoning
Multimodal
o1-pro
200K
$150.00
$600.00
Function Calling
JSON Output
Vision
Code Generation
Multimodal
o1-mini
128K
$1.10
$0.55
Save 50%
$4.40
Function Calling
JSON Output
Vision
Reasoning
Multimodal
GPT-4.1 nano
1M
$0.10
$0.03
Save 70%
$0.40
Function Calling
JSON Output
So sánh chi phí
Nhập số lượng tokens để so sánh chi phí giữa các model:
💡 Lưu ý quan trọng:
- Giá có thể thay đổi theo chính sách nhà cung cấp
- Một số model có giá khuyến mãi theo volume
- Training costs chỉ áp dụng khi fine-tuning
- Cache pricing giúp tiết kiệm đáng kể với context dài
📚 Giải thích thuật ngữ
Token: Là đơn vị cơ bản mà mô hình xử lý. Một token có thể là một từ, một phần của từ, hoặc một dấu câu. 1000 token tương đương khoảng 750 từ tiếng Anh. Tính toán Token ở đây
Cửa sổ ngữ cảnh (Context Window): Là lượng thông tin (tính bằng token) mà mô hình có thể ghi nhớ và xử lý trong một cuộc hội thoại.
Cached Input (Hoặc Prompt Caching): Là tính năng lưu lại các phần của prompt đã xử lý để tái sử dụng, giúp giảm chi phí cho các lệnh gọi lặp lại. `Write` là chi phí để lưu, `Read` là chi phí để đọc lại từ bộ nhớ cache.
Nguồn: Chính thức từ OpenAI, Anthropic, Google, DeepSeek và các nhà cung cấp khác