OpenAI và Microsoft bị New York Times kiện vì sử dụng trái phép bài viết

Thứ Bảy, 30/12/2023 16:46

OpenAI, công ty phát triển ChatGPT và Microsoft đã bị New York Times kiện vì thu thập và sử dụng trái phép bài viết để huấn luyện AI.

Trong đơn kiện gửi lên Tòa án Liên bang ở Manhattan vào ngày 27/12, New York Times đưa ra cáo buộc rằng OpenAI và Microsoft đã sử dụng “hàng triệu bài báo” mà không xin phép để huấn luyện mô hình ngôn ngữ lớn (LLM) và tạo ra nội dung mới dựa trên những gì trí tuệ nhân tạo (AI) đã “học” được. Trang báo này cũng cho biết đã cố gắng thương lượng và đàm phán trong nhiều tháng nhưng không thành công. Các cuộc đàm phán không đi đến giải pháp chung nào cả.

Báo The Washington cho biết các mô hình LLM như ChatGPT hoạt động bằng cách thu thập lượng lớn tài nguyên từ Internet, sau đó phân tích mối liên hệ, phát triển khả năng dự đoán từ nào sẽ nói tiếp theo trong câu, cho phép chúng bắt chước lời nói của con người. Mặc dù OpenAI, Microsoft và Google đã từ chối tiết lộ thông tin về dữ liệu huấn luyện AI nhưng các LLM trước đây được chứng minh đã sử dụng lượng lớn nội dung từ các tổ chức tin tức và danh mục sách.

New York Times cảnh báo rằng các mô hình AI của OpenAI và Microsoft có thể đe dọa báo chí chất lượng cao khi tạo ra nội dung chứa nhiều đoạn “trích dẫn nguyên văn bài báo, tóm tắt hoặc bắt chước văn phong”. Điều này cũng đe dọa chất lượng của báo chí và “gây tổn hại năng lực” đến báo như mất độc giả, mất doanh thu trả phí và mất doanh thu quảng cáo.

“Thông qua Bing Chat (gần đây đã đổi tên thành Copilot) của Microsoft và ChatGPT của OpenAI, họ đang cố gắng khai thác lợi ích từ khoản đầu tư khổng lồ của chúng tôi vào các hoạt động báo chí để phát triển các sản phẩm thay thế mà không xin phép hoặc trả tiền”, trang này cho hay. Đồng thời, New York Times yêu cầu hai công ty này phải chịu trách nhiệm pháp lý “trước hàng tỷ USD thiệt hại” do sao chép nội dung và chấm dứt việc sử dụng các bài báo để huấn luyện LLM. Ngoài ra, họ cũng yêu cầu gỡ bỏ các bài đã dùng để đào tạo trí tuệ nhân tạo khỏi hệ thống.

Hiện tại, cả OpenAI và Microsoft đều chưa đưa ra bình luận.

The Verge, trang tin công nghệ, giới chuyên gia pháp lý đánh giá rằng nếu vụ kiện này thành công thì có thể sẽ mở đường cho các tổ chức tin tức khác khởi kiện các công ty có mô hình LLM dùng nội dung báo chí hiện nay. Trên thực tế, các tác phẩm báo chí được tạo ra bằng trí tuệ nhân tạo đang ngày càng gia tăng, nhưng nhiều trong số chúng lại không đảm bảo độ chính xác.

NewsGuard, một tổ chức theo dõi thông tin sai lệch có trụ sở tại New York cho biếtAI khiến việc sản xuất và lan truyền tin giả lên cấp độ mới, nó có thể tạo ra thông tin sai lệch về bầu cử, chiến tranh và thiên tai với tốc độ nhanh chóng. Từ tháng 5, số lượng trang web chứa tin giả được tạo ra bằng AI đã tăng 1.000%, từ 49 trang lên hơn 600 trang.

Ngoài ra, New York Times đã nhóm chống lại các công ty dùng tác phẩm của họ để đào tạo AI, bao gồm các nghệ sĩ, nhà làm phim, nhà văn, nhạc sĩ và những người sáng tạo nội dung. Tính đến tháng 8, ít nhất 583 tổ chức tin tức, trong đó có những tên tuổi lớn như New York Times, Washington Post và Reuters đã đặt trình chặn nhằm ngăn chặn các công ty công nghệ thu thập bài viết mà không xin phép.

“Chúng tôi đang xem xét khiếu nại của New York Times và ủng hộ quyết định của họ trong việc bảo vệ nguyên tắc bản quyền quan trọng này,” Washington Post cho biết.

Hiện tại, OpenAI đã hợp tác với một số tổ chức tin tức để trả tiền cho các nội dung được sử dụng trong quá trình đào tạo trí tuệ nhân tạo. Vào tháng 7, họ đã ký thỏa thuận với Associated Press. Đầu tháng này, nhà xuất bản Axel Springer của Đức, sở hữu Politico và Business Insider cũng có thỏa thuận tương tự với công ty đứng sau ChatGPT.