Scale AI bị nghi rò rỉ dữ liệu nhạy cảm do quản lý tài liệu kém trên Google Docs

Trần Huệ

Thứ Tư, 25/06/2025 06:15

Công ty công nghệ Scale AI – đơn vị chuyên dán nhãn dữ liệu do Alexandr Wang đồng sáng lập – đang đối mặt với nghi vấn rò rỉ hàng nghìn tài liệu nhạy cảm sau khi bị phát hiện sử dụng Google Docs công khai để quản lý công việc với các khách hàng lớn như Google, Meta và xAI.

Theo Business Insider, nhiều liên kết dẫn tới tài liệu của Scale AI có thể truy cập tự do nếu biết đường dẫn, trong đó một số còn cho phép chỉnh sửa nội dung. Các tập tin này chứa nhiều thông tin cá nhân quan trọng của hàng nghìn nhà thầu và cộng tác viên, bao gồm họ tên, địa chỉ, số ID, email cá nhân, thậm chí cả thông tin đánh giá mức độ nghi ngờ gian lận trong quá trình phân loại dữ liệu.

Công ty hiện đang vận hành một “đội quân dán nhãn” với hơn 240.000 nhân sự toàn cầu, theo Bloomberg. Các chuyên gia an ninh mạng cảnh báo cách quản lý dữ liệu lỏng lẻo như vậy có thể mở đường cho tin tặc tấn công, mạo danh người lao động hoặc phát tán phần mềm độc hại.

Trước phản ứng từ dư luận, ngày 25/6, đại diện Scale AI cho biết đã bắt đầu một cuộc điều tra nội bộ. Đồng thời, công ty cũng đã khóa quyền truy cập của tất cả các tài liệu liên quan, chuyển chế độ từ công khai sang riêng tư. Tuy hành động này giúp hạn chế rủi ro bảo mật, nhưng cũng khiến nhiều nhóm nhân viên không thể tiếp cận tài liệu đào tạo, gây gián đoạn công việc.

Một số nhân viên cho biết họ vẫn có thể truy cập tài liệu, nhưng chỉ trong phạm vi những người được chỉ định. Một trưởng nhóm nói: “Công việc của chúng tôi tạm thời bị đình trệ. Giờ thì chỉ có thể… ngồi chờ”.

Sự việc xảy ra đúng thời điểm giới công nghệ đang chú ý đến Scale AI sau khi Meta mua lại 49% cổ phần, định giá công ty ở mức 14,3 tỷ USD. Alexandr Wang, nhà sáng lập mới 27 tuổi, từng rời MIT năm 2016 để cùng Lucy Guo thành lập Scale AI. Đến năm 2019, giải pháp của họ đã phục vụ hơn 300 doanh nghiệp, bao gồm các hãng xe tự lái như Waymo (Alphabet), Cruise (General Motors) và Uber.

Dù nổi lên là “cánh tay phải” của nhiều mô hình AI, Scale AI cũng từng bị chỉ trích vì điều kiện làm việc khắc nghiệt, lương thấp, thiếu minh bạch trong quy trình dán nhãn, và lỏng lẻo trong bảo mật dữ liệu khách hàng. Theo Telegraph, công ty đã huy động được hơn 1,6 tỷ USD, với sự góp mặt của các quỹ lớn như Y Combinator, Founders Fund, cùng các ông lớn công nghệ như Amazon, Meta, Intel và Qualcomm.

Giới quan sát cho rằng việc lộ dữ liệu hàng loạt tại Scale AI có thể làm ảnh hưởng nghiêm trọng đến niềm tin của khách hàng và đối tác, đặc biệt trong bối cảnh các mô hình AI hiện nay phụ thuộc rất nhiều vào chất lượng dữ liệu huấn luyện.

“Nếu không thể quản lý được tài liệu nội bộ, thì lấy gì đảm bảo độ tin cậy của những bộ dữ liệu mà họ cung cấp cho AI?”, một chuyên gia tại Viện Nghiên cứu An ninh mạng Quốc tế bình luận.

Hiện Scale AI vẫn chưa đưa ra thông báo chính thức về số lượng tệp bị ảnh hưởng, danh sách khách hàng liên quan, hay kế hoạch khắc phục lâu dài. Tuy nhiên, với mức độ nghiêm trọng của vụ việc, nhiều người dự đoán công ty có thể sẽ đối mặt với điều tra từ phía cơ quan chức năng, cũng như bị yêu cầu tăng cường kiểm soát bảo mật trong các thỏa thuận hợp tác tương lai.