Cuộc chiến benchmark chip AI nóng lại khi các đối thủ của Nvidia tung số liệu thực tế

Nvidia GB300 NVL72 thiết lập kỷ lục benchmark mới, nhưng AMD và các dòng chip ASIC đang trỗi dậy mạnh mẽ nhằm tối ưu hóa chi phí suy luận và hiệu năng AI.

Kết quả benchmark suy luận (inference) mới nhất từ MLCommons đã đánh dấu một bước ngoặt trong cách thị trường đánh giá phần cứng AI. Nếu như trước đây, các cuộc đua chủ yếu tập trung vào việc huấn luyện (training) các mô hình khổng lồ, thì giờ đây, chi phí vận hành thực tế mới là bài toán khiến các doanh nghiệp quan tâm hàng đầu. Hệ thống GB300 NVL72 của Nvidia vừa thiết lập một tiêu chuẩn mới khi vượt qua chính nền tảng GB200 tiền nhiệm tới 45% trong các bài kiểm tra suy luận DeepSeek R1. Với các nâng cấp về tensor core, định dạng NVFP4 và băng thông NVLink 130 TB/s, Nvidia vẫn giữ vững ngôi vương về hiệu năng thuần túy trên các mô hình phổ biến như Llama 3.1 hay Whisper. Tuy nhiên, sự thống trị này không còn đi kèm với sự tĩnh lặng của thị trường. Khi mỗi phản hồi từ mô hình đều gắn liền với một hóa đơn tiền điện và chi phí hạ tầng, các bên mua bắt đầu quan tâm sát sao đến số lượng token hữu dụng trên mỗi watt điện, thay vì chỉ nhìn vào những con số hào nhoáng trên bảng xếp hạng.

Sự trỗi dậy của các giải pháp thay thế và làn sóng chip tự thiết kế

AMD đang thực hiện những bước đi chiến lược để phá vỡ thế độc tôn của Nvidia thông qua các hợp đồng cung ứng khổng lồ thay vì chỉ so kè điểm số benchmark. OpenAI đã ký thỏa thuận sử dụng 6 gigawatt chip GPU AMD Instinct, bắt đầu với dòng MI450 vào năm 2026. Meta cũng theo sau với thỏa thuận trị giá hơn 100 tỷ USD, có thể giúp họ sở hữu tới 10% cổ phần AMD nếu đạt được các cột mốc quan trọng. Những con số này cho thấy các tập đoàn công nghệ sẵn sàng chấp nhận một lựa chọn có thể chưa dẫn đầu về tốc độ xử lý tuyệt đối, nhưng mang lại lợi thế về kinh tế và sự ổn định của chuỗi cung ứng. Một nhà cung cấp thứ hai đủ năng lực sẽ trở thành công cụ đàm phán sắc bén để giảm bớt sự phụ thuộc vào hệ sinh thái CUDA.

Áp lực thực sự đối với Nvidia còn đến từ các dòng chip tùy chỉnh (ASIC) của những khách hàng lớn nhất. Google có TPU, Amazon có Trainium, và Microsoft có Maia. Đứng sau làn sóng này là Broadcom, đơn vị vừa đạt thỏa thuận cung cấp bộ tăng tốc tùy chỉnh 10 gigawatt cho OpenAI và khởi xướng nền tảng AI XPV trị giá 35 tỷ USD. Việc các nhà cung cấp dịch vụ đám mây tự phát triển silicon không nhằm mục đích thương mại hóa rộng rãi, mà để tối ưu hóa tuyệt đối cho các mô hình nội bộ của họ. Khi hiệu quả vận hành thực tế trở thành thước đo sống còn cho lợi nhuận, các chip chuyên biệt hóa cao đang dần chiếm ưu thế trước các giải pháp đa năng trong các tác vụ suy luận quy mô lớn.

Cuộc chiến benchmark hiện nay không còn là câu chuyện về việc ai nhanh nhất, mà là ai mang lại hiệu quả kinh tế tốt nhất trên từng đơn vị năng lượng tiêu thụ. Nvidia vẫn dẫn đầu nhờ hệ sinh thái phần mềm hoàn thiện và khả năng xử lý đa nhiệm vượt trội, nhưng sự xuất hiện của các đối thủ như AMD và các giải pháp ASIC đã mang lại cho người mua quyền lựa chọn và khả năng kiểm soát chi phí. Đối với các doanh nghiệp, đây là thời điểm cần đánh giá lại hạ tầng dựa trên các chỉ số thực tế như chi phí trên mỗi tokenđộ trễ dưới tải trọng thực, thay vì chỉ dựa vào sức mạnh tính toán thuần túy trên giấy tờ.

LIÊN HỆ TƯ VẤN CÁC DỊCH VỤ AI
Hỗ trợ tư vấn, đào tạo và chuyển giao giải pháp AI cho cá nhân, doanh nghiệp và tổ chức.
Share your love
Chat Zalo Chat Zalo
Gọi ngay Chat