Shopping Cart

No products in the cart.

So sánh giá API của các nhà cung cấp AI

Giá được tính theo $/1M tokens, cập nhật lần cuối: 15/06/2025

Anthropic

3 model(s)

Claude Opus 4

200K
$15.00
$1.50 Save 90%
$75.00
Function Calling JSON Output Vision Artifacts

Claude Sonnet 4

200K
$3.00
$0.30 Save 90%
$15.00
Function Calling JSON Output Vision Artifacts

Claude Haiku 3.5

200K
$0.80
$0.08 Save 90%
$4.00
Function Calling JSON Output Vision Artifacts

DeepSeek

2 model(s)

deepseek-chat

64K
$0.27
$0.07 Save 74%
$1.10
Function Calling JSON Output

deepseek-reasoner

64K
$0.55
$0.14 Save 75%
$2.19
Function Calling JSON Output Reasoning

Google

2 model(s)

Gemini 2.5 Flash Preview

1M
$0.15
$0.25
$3.50
Function Calling JSON Output Vision Audio Reasoning Code Generation Multimodal

Gemini 2.5 Pro Preview

1M
$2.50
$0.63 Save 75%
$15.00
Function Calling JSON Output Vision Audio Reasoning Multimodal

OpenAI

10 model(s)

GPT-4.1

1M
$2.00
$0.50 Save 75%
$8.00
$25.00
Function Calling JSON Output Vision Audio Code Generation

GPT-4o

128K
$2.50
$1.25 Save 50%
$10.00
Function Calling JSON Output Vision Audio Multimodal

o3

200K
$2.00
$0.50 Save 75%
$8.00
Function Calling JSON Output Vision Audio Reasoning Code Generation Multimodal

GPT-o4-mini

200K
$1.10
$0.28 Save 75%
$4.40
Function Calling JSON Output Vision Audio Reasoning Code Generation Multimodal

o3-pro

200K
$20.00
$80.00
Function Calling JSON Output Vision Reasoning Multimodal

o3-mini

200K
$1.10
$0.55 Save 50%
$4.40
Function Calling JSON Output Vision Reasoning Multimodal

o1

200K
$15.00
$7.50 Save 50%
$60.00
Function Calling JSON Output Vision Reasoning Multimodal

o1-pro

200K
$150.00
$600.00
Function Calling JSON Output Vision Code Generation Multimodal

o1-mini

128K
$1.10
$0.55 Save 50%
$4.40
Function Calling JSON Output Vision Reasoning Multimodal

GPT-4.1 nano

1M
$0.10
$0.03 Save 70%
$0.40
Function Calling JSON Output

So sánh chi phí

Nhập số lượng tokens để so sánh chi phí giữa các model:

💡 Lưu ý quan trọng:

  • Giá có thể thay đổi theo chính sách nhà cung cấp
  • Một số model có giá khuyến mãi theo volume
  • Training costs chỉ áp dụng khi fine-tuning
  • Cache pricing giúp tiết kiệm đáng kể với context dài

📚 Giải thích thuật ngữ

Token: Là đơn vị cơ bản mà mô hình xử lý. Một token có thể là một từ, một phần của từ, hoặc một dấu câu. 1000 token tương đương khoảng 750 từ tiếng Anh. Tính toán Token ở đây

Cửa sổ ngữ cảnh (Context Window): Là lượng thông tin (tính bằng token) mà mô hình có thể ghi nhớ và xử lý trong một cuộc hội thoại.

Cached Input (Hoặc Prompt Caching): Là tính năng lưu lại các phần của prompt đã xử lý để tái sử dụng, giúp giảm chi phí cho các lệnh gọi lặp lại. `Write` là chi phí để lưu, `Read` là chi phí để đọc lại từ bộ nhớ cache.

Nguồn: Chính thức từ OpenAI, Anthropic, Google, DeepSeek và các nhà cung cấp khác