Ngày thứ Năm vừa qua, Google đã gây chú ý khi công bố phiên bản “tái định hình” của công cụ nghiên cứu Gemini Deep Research, dựa trên mô hình nền tảng tiên tiến Gemini 3 Pro. Đây không chỉ là một công cụ tạo báo cáo thông thường; nó còn cho phép các nhà phát triển nhúng trực tiếp khả năng nghiên cứu mô hình SATA của Google vào các ứng dụng của riêng họ, mở ra một kỷ nguyên mới của trí tuệ nhân tạo tác tử (agentic AI).
Khả năng này được thực hiện thông qua Interactions API mới của Google, được thiết kế để mang lại cho các nhà phát triển quyền kiểm soát lớn hơn trong việc xây dựng các hệ thống AI phức tạp. Gemini Deep Research là một tác tử được trang bị để tổng hợp lượng lớn thông tin và xử lý các tập dữ liệu ngữ cảnh khổng lồ trong một lời nhắc duy nhất, được khách hàng sử dụng cho nhiều nhiệm vụ từ thẩm định doanh nghiệp đến nghiên cứu an toàn độc tính thuốc.
Một điểm nhấn quan trọng là Gemini 3 Pro được Google khẳng định là mô hình “chính xác nhất” của họ, được huấn luyện để giảm thiểu tối đa hiện tượng ảo giác (hallucinations) trong các tác vụ phức tạp. Hiện tượng AI tự ý tạo ra thông tin không có thật là một vấn đề đặc biệt nghiêm trọng đối với các nhiệm vụ tác tử đòi hỏi suy luận sâu, kéo dài, nơi nhiều quyết định tự động được đưa ra trong vài phút, vài giờ hoặc lâu hơn. Càng nhiều lựa chọn mà một mô hình ngôn ngữ lớn (LLM) phải đưa ra, khả năng một lựa chọn bị ảo giác sẽ làm mất hiệu lực toàn bộ kết quả càng cao.
Để chứng minh tiến bộ này, Google đã tạo ra một bộ tiêu chuẩn mới mang tên DeepSearchQA (đã được mã nguồn mở), và thử nghiệm Deep Research trên các tiêu chuẩn độc lập như Humanity’s Last Exam (một tiêu chuẩn kiến thức tổng quát đầy thách thức) và BrowserComp (tiêu chuẩn cho các tác vụ tác tử dựa trên trình duyệt). Kết quả cho thấy tác tử mới của Google vượt trội trên các tiêu chuẩn của chính họ và Humanity’s Last Exam. Tuy nhiên, ChatGPT 5 Pro của OpenAI lại bám rất sát và thậm chí nhỉnh hơn một chút trên BrowserComp.
Tuy nhiên, những so sánh điểm chuẩn này gần như đã lỗi thời ngay khi Google công bố. Bởi lẽ, cùng ngày đó, OpenAI đã chính thức ra mắt GPT 5.2 được mong đợi từ lâu, với tên mã là Garlic. OpenAI khẳng định mô hình mới nhất của họ vượt trội hơn các đối thủ, đặc biệt là Google, trên một loạt các tiêu chuẩn điển hình, bao gồm cả tiêu chuẩn tự phát triển của OpenAI. Google cũng cho biết sẽ sớm tích hợp tác tử nghiên cứu chuyên sâu mới này vào các dịch vụ của mình, bao gồm Google Search, Google Finance, ứng dụng Gemini và NotebookLM phổ biến của họ, cho thấy một bước tiến nữa hướng tới thế giới nơi con người không còn “Google” mọi thứ nữa, mà các tác tử AI của họ sẽ làm điều đó.
Đáng chú ý nhất có lẽ là thời điểm công bố. Việc Google tung ra tin tức về AI của riêng mình, trong khi biết rằng thế giới đang chờ đợi sự ra mắt của Garlic, cho thấy một động thái chiến lược đầy tính toán trong cuộc đua công nghệ. Điều này không chỉ khẳng định sự cạnh tranh khốc liệt giữa hai gã khổng lồ mà còn mở ra một chương mới đầy hứa hẹn về khả năng nghiên cứu và ứng dụng AI trong tương lai. Người dùng và các nhà phát triển có thể mong đợi những bước đột phá đáng kể, giúp giải quyết các vấn đề phức tạp và tối ưu hóa quy trình làm việc.




