Đại gia công nghệ đánh cắp video YouTube của bạn huấn luyện AI

Cứ ngỡ câu chuyện về AI tạo sinh đã đủ gây lo ngại cho các nhà làm phim và nhà sáng tạo nội dung, thì The Atlantic lại tung ra một tin tức chấn động. Họ đã phơi bày hành vi thu thập trái phép gần 16 triệu video YouTube để huấn luyện thế hệ AI tạo sinh tiếp theo. Điều đáng nói là, những công ty đứng sau hành vi này không phải là những startup vô danh, mà là các tập đoàn công nghệ khổng lồ, đang sử dụng chính nội dung bạn đăng tải trên YouTube để đào tạo những chương trình mà họ mong muốn sẽ thay thế bạn.

Đây không chỉ là một sự vi phạm trắng trợn các điều khoản dịch vụ mà còn là một mối đe dọa hiện hữu đối với sự nghiệp sáng tạo của chúng ta. Hãy cùng tìm hiểu sâu hơn về “vụ cướp” dữ liệu chưa từng có tiền lệ này và những tác động của nó. Chúng ta cần hiểu rõ tình hình để cùng nhau đối mặt với thách thức lớn này, bảo vệ công sức và sự sáng tạo của chính mình trong kỷ nguyên số.

Nội dung chính

1 Vụ cướp dữ liệu chưa từng có tiền lệ
2 Tác động đến những người làm phim và nhà sáng tạo nội dung

Vụ cướp dữ liệu chưa từng có tiền lệ

Cuộc điều tra, một phần của chuyên mục AI Watchdog mới trên The Atlantic, tiết lộ rằng hơn 15,8 triệu video từ hơn 2 triệu kênh YouTube đã bị tải xuống mà không có sự cho phép. Bạn có thể sử dụng công cụ tìm kiếm của họ để kiểm tra xem video nào đang được dùng để huấn luyện các mô hình AI tạo sinh, và những công ty công nghệ nào đang sử dụng tài liệu đó. Bản thân tôi cũng đã thử tìm kiếm và phát hiện một vài video của No Film School nằm trong danh sách, quả thật là một trải nghiệm không mấy vui vẻ.

Tất nhiên, việc này đi ngược lại hoàn toàn với điều khoản dịch vụ của YouTube, nhưng các công ty AI đang tìm cách lách luật thông qua các ứng dụng bên thứ ba và nhiều thủ thuật khác. Mặc dù không phải tất cả video YouTube đều có bản quyền, nhưng nhiều video được tìm thấy trong cuộc điều tra của The Atlantic lại là những tác phẩm được bảo hộ. Nhiều công ty công nghệ lớn, bao gồm Microsoft, Meta, Amazon, Nvidia, Runway, ByteDance, Snap và Tencent, đã sử dụng các bộ dữ liệu này để huấn luyện AI của họ. Khi được hỏi, chỉ có Meta, Amazon và Nvidia phản hồi, tất cả đều khẳng định họ “tôn trọng” người sáng tạo nội dung và tin rằng việc sử dụng tác phẩm là hợp pháp theo luật bản quyền hiện hành. Amazon thậm chí còn chia sẻ rằng họ đang tập trung phát triển cách tạo “quảng cáo chất lượng cao, hấp dẫn từ những lời nhắc đơn giản” đối với video.

Tác động đến những người làm phim và nhà sáng tạo nội dung

Mặc dù phần lớn nội dung trên YouTube không phải do các nhà làm phim chuyên nghiệp tạo ra, nhưng điều đáng lo ngại là các công ty AI lại đặc biệt nhắm đến tác phẩm của những người làm phim. Một bảng tính bị rò rỉ cho 404 Media từ một cựu nhân viên của Runway – công ty chuyên xây dựng công cụ tạo video AI – cho thấy những gì họ đánh giá cao ở một số kênh: “chuyển động máy quay cao”, “phong cảnh điện ảnh đẹp”, “cảnh phim chất lượng cao”, “phim ngắn khoa học viễn tưởng chất lượng siêu cao”. Một kênh được gắn nhãn “THÁNH ĐỊA CỦA ĐIỆN ẢNH Ô TÔ TỪ TRƯỚC ĐẾN NAY”; một kênh khác được ghi chú “chỉ có 4 video nhưng chúng thực sự rất tốt”.

Điều này có nghĩa là các công ty AI đang xem đây là một cách để đào tạo công nghệ của họ nhằm thay thế chính những người đang tạo ra các kênh này. Hãy tưởng tượng bạn đã học hỏi tất cả những kỹ thuật quay phim, ý tưởng độc đáo và phát triển giọng điệu riêng của mình, chỉ để nó được đưa vào một cỗ máy để sao chép bạn? Đó chính xác là những gì đang diễn ra ngay bây giờ. Đây không chỉ là một vụ vi phạm bản quyền lớn, mà còn là mối đe dọa hiện sinh đối với các ngành nghề sáng tạo ở khắp mọi nơi. Mỗi khung hình tác phẩm của bạn mà họ thu thập đều được sử dụng để xây dựng một công cụ hiệu quả hơn nhằm thay thế bạn. Họ không phải đang tăng cường sự sáng tạo của con người, mà đang tự động hóa nó để cắt giảm chi phí.

Các cuộc đình công của WGA và SAG-AFTRA đã đặt một dấu mốc quan trọng, nhưng mặt trận mới này – dữ liệu video – là nơi cuộc chiến tiếp theo sẽ diễn ra. Đây không phải là về việc ngăn chặn công nghệ; mà là về việc đòi hỏi sự đồng thuận, bồi thường và kiểm soát. Cảm thấy choáng ngợp là điều dễ hiểu, nhưng bỏ cuộc thì không phải là một lựa chọn. Hãy chia sẻ báo cáo của The Atlantic và công cụ tìm kiếm với mọi nhà sáng tạo mà bạn biết. Vấn đề này quá lớn để giải quyết chỉ bằng các vụ kiện. Chúng ta cần luật pháp rõ ràng, mạnh mẽ để bảo vệ quyền của người sáng tạo và buộc các nhà phát triển AI phải minh bạch. Báo cáo này thật sự gây sốc và phẫn nộ. Cảm giác như tất cả các công ty này chỉ đang đánh cắp sản phẩm của chúng ta, chờ bị bắt và trả một khoản phí nhỏ để tiếp tục. Thật đáng buồn, nhưng tất cả chúng ta đều đang ở trong cuộc chiến này cùng nhau.

Đại gia công nghệ đánh cắp video YouTube của bạn huấn luyện AI

Vụ cướp dữ liệu chưa từng có tiền lệ

Tác động đến những người làm phim và nhà sáng tạo nội dung

Nâng cấp Cursor

Augment Code

Cung cấp API GEMINI

Cung cấp API GROK

Xây dựng Chatbot AI theo dữ liệu doanh nghiệp

Vụ cướp dữ liệu chưa từng có tiền lệ

Tác động đến những người làm phim và nhà sáng tạo nội dung

Bài viết liên quan