So sánh giá API AI - OpenAI, Claude, Gemini, DeepSeek

So sánh giá API của các nhà cung cấp AI

Giá được tính theo $/1M tokens, cập nhật lần cuối: 08/04/2026

Anthropic

3 model(s)

Claude Opus 4

200K

Input $15.00

Cached Input $1.50 Save 90%

Output $75.00

Tính năng:

Function Calling JSON Output Vision Artifacts

Claude Sonnet 4

200K

Input $3.00

Cached Input $0.30 Save 90%

Output $15.00

Tính năng:

Function Calling JSON Output Vision Artifacts

Claude Haiku 3.5

200K

Input $0.80

Cached Input $0.08 Save 90%

Output $4.00

Tính năng:

Function Calling JSON Output Vision Artifacts

DeepSeek

2 model(s)

deepseek-chat

64K

Input $0.27

Cached Input $0.07 Save 74%

Output $1.10

Tính năng:

Function Calling JSON Output

deepseek-reasoner

64K

Input $0.55

Cached Input $0.14 Save 75%

Output $2.19

Tính năng:

Function Calling JSON Output Reasoning

Google

2 model(s)

Gemini 2.5 Flash Preview

Input $0.15

Cached Input $0.25

Output $3.50

Tính năng:

Function Calling JSON Output Vision Audio Reasoning Code Generation Multimodal

Gemini 2.5 Pro Preview

Input $2.50

Cached Input $0.63 Save 75%

Output $15.00

Tính năng:

Function Calling JSON Output Vision Audio Reasoning Multimodal

OpenAI

10 model(s)

GPT-4.1

Input $2.00

Cached Input $0.50 Save 75%

Output $8.00

Training $25.00

Tính năng:

Function Calling JSON Output Vision Audio Code Generation

GPT-4o

128K

Input $2.50

Cached Input $1.25 Save 50%

Output $10.00

Tính năng:

Function Calling JSON Output Vision Audio Multimodal

o3

200K

Input $2.00

Cached Input $0.50 Save 75%

Output $8.00

Tính năng:

Function Calling JSON Output Vision Audio Reasoning Code Generation Multimodal

GPT-o4-mini

200K

Input $1.10

Cached Input $0.28 Save 75%

Output $4.40

Tính năng:

Function Calling JSON Output Vision Audio Reasoning Code Generation Multimodal

o3-pro

200K

Input $20.00

Output $80.00

Tính năng:

Function Calling JSON Output Vision Reasoning Multimodal

o3-mini

200K

Input $1.10

Cached Input $0.55 Save 50%

Output $4.40

Tính năng:

Function Calling JSON Output Vision Reasoning Multimodal

o1

200K

Input $15.00

Cached Input $7.50 Save 50%

Output $60.00

Tính năng:

Function Calling JSON Output Vision Reasoning Multimodal

o1-pro

200K

Input $150.00

Output $600.00

Tính năng:

Function Calling JSON Output Vision Code Generation Multimodal

o1-mini

128K

Input $1.10

Cached Input $0.55 Save 50%

Output $4.40

Tính năng:

Function Calling JSON Output Vision Reasoning Multimodal

GPT-4.1 nano

Input $0.10

Cached Input $0.03 Save 70%

Output $0.40

Tính năng:

Function Calling JSON Output

So sánh chi phí

Nhập số lượng tokens để so sánh chi phí giữa các model:

Input Tokens:

Output Tokens:

💡 Lưu ý quan trọng:

Giá có thể thay đổi theo chính sách nhà cung cấp
Một số model có giá khuyến mãi theo volume
Training costs chỉ áp dụng khi fine-tuning
Cache pricing giúp tiết kiệm đáng kể với context dài

📚 Giải thích thuật ngữ

Token: Là đơn vị cơ bản mà mô hình xử lý. Một token có thể là một từ, một phần của từ, hoặc một dấu câu. 1000 token tương đương khoảng 750 từ tiếng Anh. Tính toán Token ở đây

Cửa sổ ngữ cảnh (Context Window): Là lượng thông tin (tính bằng token) mà mô hình có thể ghi nhớ và xử lý trong một cuộc hội thoại.

Cached Input (Hoặc Prompt Caching): Là tính năng lưu lại các phần của prompt đã xử lý để tái sử dụng, giúp giảm chi phí cho các lệnh gọi lặp lại. `Write` là chi phí để lưu, `Read` là chi phí để đọc lại từ bộ nhớ cache.

Nguồn: Chính thức từ OpenAI, Anthropic, Google, DeepSeek và các nhà cung cấp khác

So sánh giá API của các nhà cung cấp AI

Anthropic

Claude Opus 4

Claude Sonnet 4

Claude Haiku 3.5

DeepSeek

deepseek-chat

deepseek-reasoner

Google

Gemini 2.5 Flash Preview

Gemini 2.5 Pro Preview

OpenAI

GPT-4.1

GPT-4o

o3

GPT-o4-mini

o3-pro

o3-mini

o1

o1-pro

o1-mini

GPT-4.1 nano

Tính chi phí - Model

Kết quả:

So sánh chi phí

💡 Lưu ý quan trọng:

📚 Giải thích thuật ngữ