Startup AI Anthropic – doanh nghiệp công nghệ nổi lên nhanh chóng với chatbot Claude – đang trở thành tâm điểm chú ý khi chấp nhận bỏ ra khoản tiền tối thiểu 1,5 tỷ USD để dàn xếp vụ kiện tập thể liên quan đến vấn đề bản quyền sách. Sự kiện này được đánh giá có thể tạo bước ngoặt lớn cho cách các công ty trí tuệ nhân tạo sử dụng dữ liệu huấn luyện trong tương lai.
Thỏa thuận bồi thường lớn chưa từng có
Theo tài liệu gửi lên tòa án liên bang tại California, Anthropic đồng ý trả trung bình 3.000 USD cho mỗi cuốn sách bị cho là đã được truy cập trái phép nhằm phục vụ quá trình đào tạo mô hình AI. Ngoài khoản bồi thường cơ bản, các tác giả còn nhận thêm tiền lãi phát sinh tính từ thời điểm dữ liệu bị khai thác.
Các chuyên gia pháp lý nhận định, nếu thẩm phán phê duyệt, đây sẽ là khoản đền bù bản quyền có giá trị cao nhất lịch sử từng được công bố trong lĩnh vực trí tuệ. Không chỉ dừng ở việc chi tiền, startup AI Anthropic còn phải thực hiện nhiều cam kết nghiêm ngặt: tiêu hủy các tập dữ liệu gây tranh cãi, loại bỏ tài liệu vi phạm khỏi hệ thống và hủy bỏ những bộ sưu tập được hình thành từ nguồn sách lậu.

Nguồn dữ liệu đào tạo gây tranh cãi
Vụ kiện xoay quanh việc Anthropic sử dụng các cơ sở dữ liệu như Pirate Mirror Library và Library Genesis – những kho lưu trữ nổi tiếng chứa lượng lớn sách sao chép bất hợp pháp. Ước tính có khoảng 500.000 ấn phẩm của nhiều tác giả trên thế giới xuất hiện trong các tập dữ liệu mà công ty dùng để phát triển chatbot Claude và những sản phẩm AI khác.
Anthropic thừa nhận sẽ chi bổ sung ngân sách nếu phát hiện thêm tác phẩm nằm ngoài danh mục ban đầu. Doanh nghiệp cũng phải chịu trách nhiệm pháp lý đầy đủ nếu tiếp tục dùng dữ liệu không được cấp phép cho bất kỳ dự án đào tạo AI nào về sau.
Bước ngoặt cho kỷ nguyên AI và bản quyền
Justin Nelson, luật sư thuộc hãng Susman Godfrey – đơn vị đại diện cho nhóm nguyên đơn – cho rằng thỏa thuận này sẽ đặt ra chuẩn mực mới cho ngành trí tuệ nhân tạo. Từ trước đến nay, nhiều startup AI lập luận rằng việc thu thập dữ liệu công khai để huấn luyện mô hình ngôn ngữ lớn là hành vi “sử dụng hợp lý”. Tuy nhiên, giới sáng tạo lại khẳng định tác phẩm của họ đang bị khai thác mà không có sự đồng ý và không được trả thù lao.
“Thị trường AI cần một cơ chế công bằng hơn, nơi nghệ sĩ và tác giả được xem là đối tác cung cấp dữ liệu, chứ không phải nạn nhân của công nghệ”, Nelson nhấn mạnh. Nhận định này phản ánh xu hướng chung khi các công ty truyền thông, nhà xuất bản và cá nhân sở hữu bản quyền ngày càng siết chặt yêu cầu bồi thường.
Tranh chấp bắt đầu từ năm ngoái khi các nhà văn Andrea Bartz, Charles Graeber và Kirk Wallace Johnson gửi đơn khởi kiện Anthropic tại tòa án quận khu vực Bắc California. Họ cáo buộc startup AI này cố ý dùng kho sách lậu để rút ngắn thời gian phát triển chatbot Claude, qua đó tạo lợi thế thương mại.
Diễn biến của vụ án đã được hàng loạt doanh nghiệp AI khác và các tập đoàn truyền thông theo dõi từng bước, bởi phán quyết sẽ ảnh hưởng trực tiếp đến hàng nghìn dự án đào tạo mô hình ngôn ngữ lớn. Nhiều hãng tin lo ngại chi phí đền bù có thể làm thay đổi mô hình kinh doanh của các startup AI trên toàn cầu.
Đến thời điểm hiện tại, Anthropic chưa đưa ra bình luận chính thức về thỏa thuận 1,5 tỷ USD cũng như các cáo buộc liên quan đến việc sử dụng dữ liệu từ Pirate Mirror Library và Library Genesis. Dù vậy, hồ sơ tòa án cho thấy doanh nghiệp chấp nhận rằng họ sẽ không được miễn trừ trách nhiệm nếu để xảy ra vi phạm bản quyền trong tương lai.
Tác động lâu dài đối với chatbot Claude
Chatbot Claude là sản phẩm chủ lực giúp Anthropic trở thành startup AI có giá trị hàng chục tỷ USD. Việc tiêu hủy tập dữ liệu gây tranh cãi có thể buộc công ty phải xây dựng lại nguồn dữ liệu huấn luyện hợp pháp, ký kết với các nhà xuất bản hoặc mua bản quyền trực tiếp từ tác giả.
Các nhà phân tích công nghệ cho rằng đây có thể là tín hiệu tích cực, thúc đẩy ngành AI chuyển sang sử dụng dữ liệu được cấp phép minh bạch. Khi đó, người dùng chatbot Claude và các nền tảng AI khác sẽ được bảo đảm hơn về yếu tố pháp lý và chất lượng nội dung sách bản quyền.
Tiêu chuẩn mới cho Startup AI
Sự kiện Anthropic dàn xếp với giới tác giả cho thấy ranh giới giữa đổi mới công nghệ và quyền sở hữu trí tuệ đang được xác lập lại. Từ nay, mỗi startup AI muốn phát triển mô hình ngôn ngữ lớn như Claude có thể phải tính đến chi phí bản quyền như một phần bắt buộc của quá trình nghiên cứu.
Giới chuyên môn tin rằng thỏa thuận 1,5 tỷ USD không chỉ là câu chuyện của riêng Anthropic, mà còn là bài học chiến lược cho mọi startup AI trong kỷ nguyên mới. Công nghệ trí tuệ nhân tạo sẽ tiếp tục tiến xa, nhưng chỉ có thể bền vững khi tôn trọng giá trị của những người tạo ra tác phẩm gốc.









