Wikipedia tiết lộ cách nhận diện văn bản AI hiệu quả

Chúng ta ai cũng từng có cảm giác ngờ vực rằng nội dung mình đang đọc có thể được viết bởi một mô hình ngôn ngữ lớn, nhưng việc xác định chính xác lại vô cùng khó khăn. Một thời gian trong năm ngoái, nhiều người tin rằng các từ cụ thể như “đi sâu” hay “nhấn mạnh” có thể là dấu hiệu nhận biết, nhưng bằng chứng còn mỏng manh và khi các mô hình ngày càng tinh vi hơn, những từ ngữ tố cáo này cũng trở nên khó truy vết hơn.

May mắn thay, các biên tập viên tại Wikipedia đã khá thành công trong việc gắn cờ các văn bản do AI tạo ra. Hướng dẫn công khai của họ về “Dấu hiệu của văn bản AI” là tài liệu hữu ích nhất tôi từng tìm thấy để xác định liệu những nghi ngờ của bạn có căn cứ hay không. Kể từ năm 2023, các biên tập viên Wikipedia đã bắt đầu dự án “Dọn dẹp AI” nhằm kiểm soát các nội dung do AI gửi đến. Với hàng triệu lượt chỉnh sửa mỗi ngày, họ có vô số tài liệu để phân tích và đã tạo ra một cẩm nang chi tiết, nặng về bằng chứng theo phong cách đặc trưng của Wikipedia.

Hướng dẫn này xác nhận điều chúng ta đã biết: các công cụ tự động hầu như vô dụng trong việc phát hiện văn bản AI. Thay vào đó, nó tập trung vào những thói quen và cách diễn đạt hiếm gặp trên Wikipedia nhưng lại phổ biến trên internet nói chung (và do đó, phổ biến trong dữ liệu huấn luyện của mô hình). Theo hướng dẫn, các bài gửi từ AI thường dành nhiều thời gian để nhấn mạnh lý do một chủ đề nào đó quan trọng, thường bằng các thuật ngữ chung chung như “thời điểm then chốt” hoặc “phong trào rộng lớn hơn“. Các mô hình AI cũng có xu hướng đi sâu vào chi tiết truyền thông nhỏ lẻ để làm cho chủ thể có vẻ đáng chú ý, kiểu thông tin bạn mong đợi từ một tiểu sử cá nhân chứ không phải từ một nguồn độc lập.

Một điểm đặc biệt thú vị mà hướng dẫn chỉ ra là xu hướng kết thúc mệnh đề bằng những tuyên bố mơ hồ về tầm quan trọng. Các mô hình sẽ nói một sự kiện hay chi tiết nào đó đang “nhấn mạnh ý nghĩa” của điều gì đó, hoặc “phản ánh sự liên quan liên tục” của một ý tưởng chung chung. Đây là một đặc điểm hơi khó nhận diện, nhưng một khi bạn đã quen thuộc, bạn sẽ thấy nó ở khắp mọi nơi. Ngoài ra, còn có xu hướng sử dụng ngôn ngữ tiếp thị mơ hồ, điều này cực kỳ phổ biến trên internet. Phong cảnh luôn được mô tả là “đẹp như tranh“, tầm nhìn thì “ngoạn mục“, và mọi thứ đều “sạch sẽ và hiện đại“. Như các biên tập viên đã nhận xét, “nó nghe giống như bản ghi chép của một quảng cáo truyền hình”.

Mặc dù hướng dẫn này đáng để đọc toàn bộ, tôi thực sự rất ấn tượng với những gì nó tiết lộ. Trước đây, tôi từng nghĩ rằng văn phong của các mô hình ngôn ngữ lớn phát triển quá nhanh để có thể xác định rõ. Tuy nhiên, những thói quen được chỉ ra ở đây đã ăn sâu vào cách các mô hình AI được huấn luyện và triển khai. Chúng có thể được che giấu, nhưng sẽ rất khó để loại bỏ hoàn toàn. Nếu công chúng trở nên thành thạo hơn trong việc nhận diện văn phong AI, điều này có thể dẫn đến nhiều hệ quả thú vị.

Việc trang bị cho mình những kiến thức từ Wikipedia không chỉ giúp chúng ta đọc nội dung một cách tỉnh táo hơn mà còn góp phần xây dựng một môi trường thông tin minh bạch. Hãy áp dụng những dấu hiệu này để đánh giá các văn bản bạn đọc hàng ngày và cùng nhau nâng cao khả năng phân biệt nội dung do con người hay AI tạo ra.

Share your love
Gọi ngay Chat