Một vụ kiện chống lại Meta cáo buộc công ty này sử dụng sách vi phạm bản quyền để huấn luyện mô hình AI (trí tuệ nhân tạo).
Theo TechSpot, một nhóm tác giả tại Mỹ đã đệ đơn kiện Meta với cáo buộc công ty này sử dụng trái phép các cuốn sách để huấn luyện mô hình AI tạo sinh (generative AI). Trong khi Meta phủ nhận hành vi vi phạm bản quyền, các email nội bộ vừa được công khai cho thấy một số nhân sự cấp cao và kỹ sư của công ty đã thảo luận về việc tải xuống kho sách lậu để phục vụ quá trình huấn luyện AI.
Meta AI đang vướng vào tranh cãi pháp lý khi bằng chứng nội bộ về việc đã tải xuống và lan truyền kho sách lậu để huấn luyện AI ẢNH: META
Hồ sơ vụ kiện cho thấy Meta đã sử dụng các tập dữ liệu gây tranh cãi, bao gồm "LibGen" - kho lưu trữ hàng triệu cuốn sách bị vi phạm bản quyền. Trước đây, Meta từng lập luận rằng việc sử dụng những dữ liệu này thuộc phạm vi "sử dụng hợp lý". Tuy nhiên, các email mới tiết lộ Meta không chỉ tải về mà còn phân phối các tệp dữ liệu này thông qua mạng BitTorrent, đặt ra những vấn đề pháp lý nghiêm trọng.
Theo nội dung email, Meta đã tải xuống và chia sẻ ít nhất 81,7 terabyte dữ liệu từ nhiều kho sách vi phạm bản quyền, trong đó có 35,7 terabyte từ Z-Library và LibGen. Các nguyên đơn gọi đây là một "chiến dịch torrent đáng kinh ngạc" khi Meta không chỉ tải về mà còn chủ động lan truyền các tệp dữ liệu này ở quy mô lớn.
Một email nội bộ từ tháng 4.2023 của nhà nghiên cứu Nikolay Bashlykov thuộc Meta ghi nhận: "Torrent trên máy tính công ty có vẻ không ổn." Dù câu nói này kết thúc bằng một biểu tượng cảm xúc cười, nhưng chỉ vài tháng sau, giọng điệu của ông đã thay đổi rõ rệt. Vào tháng 9.2023, Bashlykov cho biết ông đã liên hệ với bộ phận pháp lý của Meta vì hành vi sử dụng torrent - đồng nghĩa với việc "gieo mầm" dữ liệu vi phạm bản quyền rõ ràng là vi phạm luật.
Các tài liệu cũng chỉ ra rằng Mark Zuckerberg, CEO của Meta, đã nhận thức được việc công ty sử dụng LibGen. Để tránh bị phát hiện, Meta được cho là đã triển khai các máy chủ bên ngoài hệ thống chính của Facebook nhằm che giấu hoạt động torrent và phân phối dữ liệu. Một email nội bộ khác của nhân viên Frank Zhang đề cập đến chiến thuật này với thuật ngữ "chế độ tàng hình" (stealth mode).
Hiện tại, Meta đang đầu tư mạnh vào phát triển AI và các dịch vụ liên quan đến AI tạo sinh. Công ty cũng đang tìm cách tích hợp các chatbot và nhân vật AI vào hệ sinh thái mạng xã hội của mình. Tuy nhiên, trước những bằng chứng mới được tiết lộ, Meta có thể gặp nhiều khó khăn trong việc bảo vệ lập luận "sử dụng hợp lý" của mình khi đối mặt với vụ kiện từ các tác giả.
Theo Khải Minh/ Thanh Niên
https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm