Qwen3.5-9B của Alibaba vượt mặt GPT-120B của OpenAI và chạy được trên laptop thông thường

Khám phá Qwen3.5 Small Model Series từ Alibaba. Qwen3.5-9B vượt mặt gpt-oss-120B, tối ưu cho thiết bị biên, đa phương thức và hoàn toàn miễn phí mã nguồn mở.

Đội ngũ nghiên cứu Qwen thuộc tập đoàn Alibaba vừa chính thức ra mắt dòng mô hình ngôn ngữ nhỏ Qwen3.5 Small Model Series, tạo nên một bước ngoặt về hiệu suất trong bối cảnh ngành AI tại Mỹ đang đối mặt với nhiều biến động chính trị. Series này bao gồm các biến thể từ 0.8B, 2B, 4B đến 9B, được tối ưu hóa đặc biệt cho các thiết bị biên và máy tính cá nhân. Thay vì chạy đua theo mô hình hàng nghìn tỷ tham số, Alibaba tập trung vào việc nén trí tuệ nhân tạo vào những kích thước nhỏ gọn nhưng vẫn duy trì năng lực xử lý vượt trội.

Điểm nhấn ấn tượng nhất là phiên bản Qwen3.5-9B, một mô hình suy luận tinh gọn nhưng đã đánh bại đối thủ gpt-oss-120B của OpenAI trên nhiều bảng đo lường hiệu năng quan trọng. Mặc dù có kích thước nhỏ hơn gấp 13,5 lần, Qwen3.5-9B vẫn đạt điểm số 81.7 trên thang đo GPQA Diamond (suy luận cấp độ sau đại học), vượt qua mức 80.1 của đối thủ từ Mỹ. Điều này chứng minh rằng khả năng tư duy logic và kiến thức đa ngôn ngữ chuyên sâu không còn là đặc quyền của các hệ thống siêu máy tính đắt đỏ.

Sức mạnh của dòng Qwen3.5 đến từ cấu trúc Efficient Hybrid Architecture, kết hợp giữa Gated Delta Networkssparse Mixture-of-Experts (MoE). Kiến trúc này giúp vượt qua “bức tường bộ nhớ” thường thấy trên các mô hình nhỏ, cho phép đạt tốc độ xử lý (throughput) cao hơn và độ trễ cực thấp. Bên cạnh đó, đây là những mô hình đa phương thức bản xứ (natively multimodal) nhờ kỹ thuật early fusion, giúp chúng có khả năng đọc hiểu giao diện người dùng (UI) và phân tích video vượt xa các mô hình cùng phân khúc.

Khả năng ứng dụng thực tế của Qwen3.5 đã gây kinh ngạc cho cộng đồng lập trình khi có thể chạy mượt mà trên một chiếc M1 MacBook Air hoặc ngay trong trình duyệt web. Với giấy phép Apache 2.0, Alibaba cho phép doanh nghiệp tự do tùy chỉnh, thương mại hóa và triển khai ngoại tuyến (offline) mà không lo ngại về chi phí API hay quyền riêng tư dữ liệu. Việc cung cấp cả phiên bản Base lẫn Instruct giúp các đội ngũ kỹ thuật có một “tờ giấy trắng” hoàn hảo để huấn luyện AI chuyên biệt cho các tác vụ như lập trình tự động hoặc trích xuất dữ liệu văn bản phức tạp.

Sự xuất hiện của Qwen3.5 đánh dấu thời kỳ dân chủ hóa trí tuệ nhân tạo tác vụ (agentic AI), đưa khả năng suy luận phức tạp từ đám mây xuống trực tiếp thiết bị của người dùng cuối. Doanh nghiệp hiện nay có thể tối ưu hóa quy trình vận hành bằng cách sử dụng các mô hình nhỏ này để tự động hóa các bước xử lý dữ liệu tại chỗ với chi phí vận hành cực thấp. Bạn có thể bắt đầu trải nghiệm và tích hợp các mô hình này ngay hôm nay thông qua nền tảng Hugging Face hoặc ModelScope để tận dụng lợi thế công nghệ mới nhất.

Share your love
Gọi ngay Chat