Viện Laude công bố quỹ Slingshots, thúc đẩy đánh giá AI

Vào thứ Năm vừa qua, Viện Laude đã chính thức công bố đợt cấp vốn đầu tiên từ quỹ Slingshots, một sáng kiến trọng tâm nhằm thúc đẩy khoa học và thực tiễn của trí tuệ nhân tạo. Đây là bước đi quan trọng thể hiện cam kết của viện trong việc hỗ trợ các nghiên cứu đột phá, đặc biệt trong bối cảnh AI đang phát triển mạnh mẽ.

Chương trình Slingshots được thiết kế như một bệ phóng cho các nhà nghiên cứu, cung cấp những nguồn lực mà họ khó có thể tiếp cận trong môi trường học thuật thông thường. Các hỗ trợ bao gồm tài trợ tài chính, sức mạnh tính toán (compute power), cùng với sự hỗ trợ về sản phẩm và kỹ thuật. Đổi lại, các nhà khoa học cam kết sẽ tạo ra một sản phẩm cuối cùng, có thể là một công ty khởi nghiệp, một bộ mã nguồn mở hoặc các sản phẩm trí tuệ khác.

Đợt cấp vốn ban đầu bao gồm 15 dự án, tập trung đặc biệt vào vấn đề khó khăn nhưng vô cùng cấp thiết là đánh giá AI. Một số dự án có thể đã quen thuộc với những người theo dõi công nghệ, chẳng hạn như chuẩn mực mã hóa dòng lệnh Terminal Bench và phiên bản mới nhất của dự án ARC-AGI đã tồn tại từ lâu, liên tục được cải tiến.

Các dự án khác lại mang đến những cách tiếp cận mới mẻ cho các vấn đề đánh giá đã được thiết lập. Formula Code, do các nhà nghiên cứu tại Caltech và UT Austin xây dựng, đặt mục tiêu đánh giá khả năng tối ưu hóa mã hiện có của các tác nhân AI. Trong khi đó, BizBench từ Đại học Columbia đề xuất một chuẩn mực toàn diện cho các “tác nhân AI cổ cồn trắng” trong môi trường kinh doanh. Một số khoản tài trợ khác còn khám phá các cấu trúc mới cho học tăng cường hoặc nén mô hình.

Đồng sáng lập của SWE-Bench, John Boda Yang, cũng là một phần của nhóm dự án này, với vai trò lãnh đạo dự án mới mang tên CodeClash. Lấy cảm hứng từ thành công của SWE-Bench, CodeClash sẽ đánh giá mã thông qua một khuôn khổ dựa trên cạnh tranh động. Ông Yang hy vọng rằng việc tiếp tục đánh giá trên các chuẩn mực bên thứ ba sẽ thúc đẩy tiến bộ, đồng thời bày tỏ lo ngại về một tương lai mà các chuẩn mực chỉ mang tính đặc thù cho từng công ty.

Quỹ Slingshots của Viện Laude không chỉ cung cấp nguồn lực mà còn định hướng trọng tâm nghiên cứu vào việc đánh giá AI, một lĩnh vực cốt lõi để đảm bảo sự phát triển bền vững và đáng tin cậy của công nghệ này. Những sáng kiến như vậy là cần thiết để thúc đẩy sự minh bạch, trách nhiệm giải trình và đổi mới trong cộng đồng AI toàn cầu, đồng thời tạo ra một môi trường cạnh tranh lành mạnh cho các công nghệ trí tuệ nhân tạo trong tương lai.

Share your love
Gọi ngay Chat