OpenAI nâng cấp API: GPT-5 Pro, Sora 2 và mô hình giọng nói mới

OpenAI vừa công bố những cập nhật API quan trọng tại sự kiện Dev Day, mang đến những công cụ mạnh mẽ hơn cho các nhà phát triển. Nổi bật trong số đó là GPT-5 Pro, mô hình ngôn ngữ tiên tiến nhất của hãng, cùng với Sora 2, thế hệ mới của công cụ tạo video, và một mô hình giọng nói nhỏ gọn, tiết kiệm chi phí.

Những nâng cấp này là một phần trong chiến lược thu hút các nhà phát triển gia nhập hệ sinh thái của OpenAI. Bên cạnh đó, hãng còn giới thiệu công cụ xây dựng agent và khả năng tạo ứng dụng trực tiếp trên ChatGPT, mở ra nhiều tiềm năng ứng dụng mới.

GPT-5 Pro hứa hẹn sẽ là lựa chọn lý tưởng cho các ứng dụng đòi hỏi độ chính xác cao và chiều sâu lý luận, đặc biệt trong các lĩnh vực nhạy cảm như tài chính, pháp lý và y tế. Sam Altman, CEO của OpenAI, nhấn mạnh tầm quan trọng của khả năng tương tác bằng giọng nói trong tương lai.

Để đáp ứng nhu cầu này, OpenAI ra mắt “gpt-realtime mini”, một mô hình giọng nói nhỏ hơn, chi phí thấp hơn, hỗ trợ truyền phát tương tác độ trễ thấp cho cả âm thanh và lời nói. Mô hình mới này rẻ hơn 70% so với phiên bản cao cấp trước đó nhưng vẫn đảm bảo chất lượng và biểu cảm giọng nói tương đương.

Các nhà phát triển trong hệ sinh thái OpenAI giờ đây có thể tiếp cận Sora 2 thông qua API dưới dạng xem trước. Sora 2, công cụ tạo video và âm thanh mới nhất, được giới thiệu cùng với ứng dụng Sora, một nền tảng chia sẻ video ngắn do AI tạo ra, tương tự như TikTok.

Sora 2 kế thừa và phát triển các khả năng của thế hệ trước, mang đến những cảnh quay thực tế hơn, nhất quán về mặt vật lý, với âm thanh đồng bộ và khả năng kiểm soát sáng tạo vượt trội. Người dùng có thể tùy chỉnh chi tiết từ góc quay máy ảnh đến phong cách hình ảnh.

Một điểm nhấn quan trọng của Sora 2 là khả năng kết hợp âm thanh phong phú và hiệu ứng đồng bộ với hình ảnh, không chỉ dừng lại ở lời nói. Điều này mở ra khả năng sáng tạo nội dung đa phương tiện độc đáo và hấp dẫn hơn. Sora 2 được định vị là công cụ hỗ trợ phát triển ý tưởng, từ phác thảo cho chiến dịch quảng cáo đến biến bản vẽ thành mẫu đồ chơi, như ví dụ về sự hợp tác với Mattel.

Những cải tiến này từ OpenAI không chỉ đơn thuần là nâng cấp kỹ thuật, mà còn là bước tiến quan trọng trong việc dân chủ hóa khả năng sáng tạo AI. Các nhà phát triển và doanh nghiệp giờ đây có trong tay những công cụ mạnh mẽ hơn, linh hoạt hơn để hiện thực hóa ý tưởng, từ việc xây dựng các ứng dụng chuyên sâu đến tạo ra nội dung đa phương tiện đột phá. Khuyến khích các nhà phát triển khám phá và tích hợp những API mới này vào dự án của mình để khai thác tối đa tiềm năng của trí tuệ nhân tạo.

Share your love
Gọi ngay Chat