OpenAI: GPT-5 tiệm cận con người ở nhiều công việc

Bạn có bao giờ tự hỏi liệu trí tuệ nhân tạo (AI) đã tiến xa đến mức nào trong việc thực hiện các công việc mà con người vẫn đang làm hằng ngày? OpenAI vừa công bố một thước đo mới mang tên GDPval, được thiết kế để đánh giá chính xác năng lực của các mô hình AI so với chuyên gia con người trong nhiều ngành nghề khác nhau. Kết quả ban đầu cho thấy những mô hình như GPT-5 và Claude Opus 4.1 đang ngày càng tiệm cận trình độ của bạn ở nhiều lĩnh vực, mở ra một kỷ nguyên mới về sự hợp tác giữa con người và AI.

GPT-5 đang tiến gần đến trình độ chuyên gia con người như thế nào?

Image for H2-1
GDPval là một nỗ lực đầu tiên của OpenAI nhằm hiểu rõ mức độ các hệ thống AI có thể vượt trội hơn con người trong các công việc có giá trị kinh tế, một phần quan trọng trong sứ mệnh phát triển trí tuệ nhân tạo tổng quát (AGI) của công ty. Thước đo này tập trung vào chín ngành công nghiệp đóng góp nhiều nhất vào tổng sản phẩm quốc nội (GDP) của Mỹ, bao gồm y tế, tài chính, sản xuất và chính phủ, cùng với 44 ngành nghề khác nhau, từ kỹ sư phần mềm, y tá đến nhà báo.

Trong phiên bản đầu tiên của GDPval-v0, OpenAI đã yêu cầu các chuyên gia có kinh nghiệm so sánh các báo cáo do AI tạo ra với các báo cáo của con người, sau đó chọn ra bản tốt nhất. Ví dụ, một yêu cầu có thể là phân tích bối cảnh cạnh tranh trong ngành giao hàng chặng cuối cho các chuyên gia ngân hàng đầu tư. Kết quả cho thấy GPT-5-high (một phiên bản nâng cấp của GPT-5) được xếp hạng “tốt hơn hoặc ngang bằng” với các chuyên gia trong 40.6% trường hợp. Đáng chú ý, mô hình Claude Opus 4.1 của Anthropic thậm chí còn đạt 49%, dù OpenAI cho rằng điều này có thể một phần nhờ khả năng tạo đồ họa hấp dẫn của nó.

Dù những con số này ấn tượng, điều quan trọng cần nhớ là GDPval-v0 chỉ kiểm tra một số nhiệm vụ rất cụ thể, như tạo báo cáo, chứ không phải toàn bộ quy trình làm việc phức tạp của một chuyên gia. Tuy nhiên, tốc độ tiến bộ là đáng kinh ngạc: chỉ 15 tháng trước, GPT-4o chỉ đạt 13.7% trong cùng bài kiểm tra. Tiến sĩ Aaron Chatterji, kinh tế trưởng của OpenAI, và Tejal Patwardhan, trưởng nhóm đánh giá, đều nhận định rằng kết quả này cho thấy tiềm năng to lớn để bạn tận dụng AI như một công cụ hỗ trợ để giảm tải công việc và tập trung vào những nhiệm vụ có giá trị cao hơn.

Nhìn chung, GDPval là một bước tiến quan trọng trong việc đánh giá sự tiến bộ của AI trong các ứng dụng thực tế. Thay vì lo lắng về việc bị thay thế, đây là thời điểm để bạn bắt đầu khám phá cách tích hợp AI vào quy trình làm việc của mình, biến nó thành một trợ thủ đắc lực giúp bạn nâng cao năng suất và tạo ra giá trị lớn hơn. Sự phát triển của AI không phải là mối đe dọa, mà là một cơ hội để bạn phát triển và thăng hoa trong kỷ nguyên số.

Share your love
Gọi ngay Chat