Meta bị cáo buộc dùng nội dung sách vi phạm bản quyền để huấn luyện AI

Thứ 2, 10/02/2025 | 10:23:00

342 lượt xem

Chia sẻ

Một vụ kiện chống lại Meta cáo buộc công ty này sử dụng sách vi phạm bản quyền để huấn luyện mô hình AI (trí tuệ nhân tạo).

Theo TechSpot, một nhóm tác giả tại Mỹ đã đệ đơn kiện Meta với cáo buộc công ty này sử dụng trái phép các cuốn sách để huấn luyện mô hình AI tạo sinh (generative AI). Trong khi Meta phủ nhận hành vi vi phạm bản quyền, các email nội bộ vừa được công khai cho thấy một số nhân sự cấp cao và kỹ sư của công ty đã thảo luận về việc tải xuống kho sách lậu để phục vụ quá trình huấn luyện AI.

Meta AI đang vướng vào tranh cãi pháp lý khi bằng chứng nội bộ về việc đã tải xuống và lan truyền kho sách lậu để huấn luyện AI ẢNH: META

Hồ sơ vụ kiện cho thấy Meta đã sử dụng các tập dữ liệu gây tranh cãi, bao gồm "LibGen" - kho lưu trữ hàng triệu cuốn sách bị vi phạm bản quyền. Trước đây, Meta từng lập luận rằng việc sử dụng những dữ liệu này thuộc phạm vi "sử dụng hợp lý". Tuy nhiên, các email mới tiết lộ Meta không chỉ tải về mà còn phân phối các tệp dữ liệu này thông qua mạng BitTorrent, đặt ra những vấn đề pháp lý nghiêm trọng.

Theo nội dung email, Meta đã tải xuống và chia sẻ ít nhất 81,7 terabyte dữ liệu từ nhiều kho sách vi phạm bản quyền, trong đó có 35,7 terabyte từ Z-Library và LibGen. Các nguyên đơn gọi đây là một "chiến dịch torrent đáng kinh ngạc" khi Meta không chỉ tải về mà còn chủ động lan truyền các tệp dữ liệu này ở quy mô lớn.

Một email nội bộ từ tháng 4.2023 của nhà nghiên cứu Nikolay Bashlykov thuộc Meta ghi nhận: "Torrent trên máy tính công ty có vẻ không ổn." Dù câu nói này kết thúc bằng một biểu tượng cảm xúc cười, nhưng chỉ vài tháng sau, giọng điệu của ông đã thay đổi rõ rệt. Vào tháng 9.2023, Bashlykov cho biết ông đã liên hệ với bộ phận pháp lý của Meta vì hành vi sử dụng torrent - đồng nghĩa với việc "gieo mầm" dữ liệu vi phạm bản quyền rõ ràng là vi phạm luật.

Các tài liệu cũng chỉ ra rằng Mark Zuckerberg, CEO của Meta, đã nhận thức được việc công ty sử dụng LibGen. Để tránh bị phát hiện, Meta được cho là đã triển khai các máy chủ bên ngoài hệ thống chính của Facebook nhằm che giấu hoạt động torrent và phân phối dữ liệu. Một email nội bộ khác của nhân viên Frank Zhang đề cập đến chiến thuật này với thuật ngữ "chế độ tàng hình" (stealth mode).

Hiện tại, Meta đang đầu tư mạnh vào phát triển AI và các dịch vụ liên quan đến AI tạo sinh. Công ty cũng đang tìm cách tích hợp các chatbot và nhân vật AI vào hệ sinh thái mạng xã hội của mình. Tuy nhiên, trước những bằng chứng mới được tiết lộ, Meta có thể gặp nhiều khó khăn trong việc bảo vệ lập luận "sử dụng hợp lý" của mình khi đối mặt với vụ kiện từ các tác giả.

Theo Khải Minh/ Thanh Niên

https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm

Từ khóa

Lời bình của bạn
Gửi ý kiến

Tin cùng chuyên mục

Thủ đoạn lừa đảo mới nhất về tích hợp điểm giấy phép lái xe mà người dân nên biết

Cục An toàn thông tin, Bộ Thông tin và Truyền thông cảnh báo thủ đoạn lừa đảo trực tuyến nổi bật tuần qua (từ ngày 3-2 đến 9-2).

17:16 - 10/02/2025

289 lượt xem

Thiết bị gập bí ẩn của Apple sẽ ra mắt vào năm sau

Apple sắp tham gia 'cuộc đua' thiết bị gập vào năm 2026.

14:20 - 10/02/2025

295 lượt xem

Pháp sẽ đầu tư 109 tỷ euro vào trí tuệ nhân tạo

Ngày 9/2, Tổng thống Emmanuel Macron khẳng định rằng, Pháp phải và sẽ "tăng tốc" trong nghiên cứu và phát triển trí tuệ nhân tạo (AI) với khoản đầu tư lên...

12:20 - 10/02/2025

304 lượt xem

Trường học Đan Mạch hạn chế điện thoại thông minh trong kì học mới

Đan Mạch đang xem xét lại lập trường của mình trong việc áp dụng công nghệ cao cho việc giảng dạy và quay trở lại ủng hộ cách tiếp cận truyền thống.

11:13 - 10/02/2025

349 lượt xem

Ổ cứng Seagate cũ được bán như 'sản phẩm mới'

Vụ việc liên quan đến Seagate đang thu hút sự chú ý khi có thông tin cho biết công ty Mỹ đã bán ổ cứng (HDD) đã qua sử dụng dưới dạng sản phẩm mới.

08:08 - 10/02/2025

419 lượt xem