213
/
178302
Hacker dùng AI để tấn công Gemini của Google
hacker-dung-ai-de-tan-cong-gemini-cua-google
news

Hacker dùng AI để tấn công Gemini của Google

Chủ nhật, 30/03/2025 | 17:17:00
1,203 lượt xem

Hacker dùng chính AI để tấn công Gemini của Google bằng kỹ thuật mới.

Theo BGR, một báo cáo nghiên cứu mới vừa công bố một kỹ thuật đáng báo động mang tên 'Fun-Tuning', khi sử dụng chính AI (trí tuệ nhân tạo) để tự động tạo ra các cuộc tấn công dạng chèn prompt cực kỳ hiệu quả nhắm vào các mô hình AI tiên tiến khác, trong đó có cả Gemini của Google.

Phương pháp này khiến việc 'bẻ khóa' AI trở nên nhanh chóng, rẻ tiền và dễ dàng hơn bao giờ hết, đánh dấu một bước leo thang mới trong cuộc chiến an ninh mạng liên quan đến AI.

Hiểm họa khi kẻ xấu dùng AI để phá vỡ AI

Tấn công chèn prompt là một kỹ thuật mà kẻ xấu lén lút đưa các chỉ dẫn độc hại vào phần dữ liệu đầu vào của một mô hình AI (ví dụ: thông qua bình luận trong mã nguồn, văn bản ẩn trên web). Mục đích là để 'đánh lừa' AI, buộc nó phải bỏ qua các quy tắc an toàn được lập trình sẵn, dẫn đến những hậu quả nghiêm trọng như làm rò rỉ dữ liệu nhạy cảm, cung cấp thông tin sai lệch, hoặc thực hiện các hành vi nguy hiểm khác.

Tin tặc đang dùng chính AI để tấn công AI 

Trước đây, việc thực hiện thành công các cuộc tấn công này, đặc biệt trên các mô hình 'đóng kín' như Gemini hay GPT-4, thường đòi hỏi rất nhiều thử nghiệm thủ công phức tạp và tốn thời gian.

Nhưng Fun-Tuning đã thay đổi hoàn toàn cục diện. Phương pháp này do một nhóm nhà nghiên cứu từ nhiều trường đại học phát triển, khai thác một cách thông minh chính giao diện lập trình ứng dụng (API) tinh chỉnh mà Google cung cấp miễn phí cho người dùng Gemini.

Bằng cách phân tích các phản ứng tinh vi của mô hình Gemini trong quá trình tinh chỉnh (ví dụ như cách nó phản hồi lại các lỗi trong dữ liệu), Fun-Tuning có thể tự động xác định các 'tiền tố' và 'hậu tố' hiệu quả nhất để che giấu một câu lệnh độc hại. Điều này làm tăng đáng kể khả năng AI sẽ tuân theo ý đồ xấu của kẻ tấn công.

Kết quả thử nghiệm cho thấy Fun-Tuning đạt tỷ lệ thành công lên đến 82% trên một số phiên bản của Gemini, một con số vượt trội so với mức dưới 30% của các phương pháp tấn công truyền thống.

Điều làm tăng thêm mức độ nguy hiểm của Fun-Tuning là chi phí thực hiện rất thấp. Do API tinh chỉnh của Google được cung cấp miễn phí, chi phí tính toán để tạo ra một cuộc tấn công hiệu quả có thể chỉ tốn khoảng 10 USD. Hơn nữa, các nhà nghiên cứu còn phát hiện một cuộc tấn công được thiết kế cho một phiên bản Gemini có thể dễ dàng áp dụng thành công trên các phiên bản khác, mở ra nguy cơ bị tấn công trên diện rộng.

Google đã xác nhận họ nhận thức được mối đe dọa từ kỹ thuật Fun-Tuning nhưng hiện chưa đưa ra bình luận về việc liệu có thay đổi cách thức hoạt động của API tinh chỉnh hay không. Nhóm nghiên cứu cũng chỉ ra bài toán khó trong việc phòng thủ rằng nếu loại bỏ các thông tin mà Fun-Tuning khai thác khỏi quá trình tinh chỉnh, API này sẽ trở nên kém hữu dụng đối với các nhà phát triển chân chính. Ngược lại, nếu giữ nguyên, nó sẽ tiếp tục là bàn đạp để kẻ xấu lợi dụng.

Sự xuất hiện của Fun-Tuning là một lời cảnh báo rõ ràng, cho thấy cuộc đối đầu trong không gian mạng đã bước sang một giai đoạn mới, phức tạp hơn. AI giờ đây không chỉ là mục tiêu bị nhắm đến mà còn trở thành chính công cụ, vũ khí trong tay của các tác nhân độc hại.

Theo Phong Đỗ/ Thanh niên

https://thanhnien.vn/hacker-dung-ai-de-tan-cong-gemini-cua-google-18525033010473121.htm

  • Từ khóa

Sinh viên sáng tạo mô hình thử trang phục ảo

Nhóm sinh viên Trường ĐH Bách khoa, ĐHQG TPHCM đã phát triển mô hình tối ưu hiệu quả thử trang phục ảo dựa trên công nghệ Virtual Try-On.
16:20 - 01/04/2025
88 lượt xem

Tủ lạnh Samsung giúp tìm điện thoại thất lạc

Trí tuệ nhân tạo được tích hợp trên dòng tủ lạnh Bespoke AI mới nhất của Samsung cho phép người dùng tìm điện thoại bị thất lạc bằng giọng nói thông qua...
14:23 - 01/04/2025
142 lượt xem

Lập trình viên Trung Quốc lo lắng trước tin Google đóng mã nguồn Android

Trong tương lai, Google có thể không còn mở cửa hoàn toàn hệ điều hành Android khiến các nhà phát triển ứng dụng Trung Quốc phải đổi hướng, chuyển sang...
10:35 - 01/04/2025
218 lượt xem

Thắp lửa đam mê nghiên cứu khoa học trong học sinh

Cuộc thi nghiên cứu khoa học, kỹ thuật cấp quốc gia là sân chơi trí tuệ dành cho học sinh trung học cơ sở và trung học phổ thông trên cả nước, nhằm khuyến...
09:21 - 01/04/2025
253 lượt xem

Bất ngờ: Học sinh tiểu học ứng dụng AI phát hiện tài xế buồn ngủ

Khi phát hiện nguy cơ mất tập trung, hệ thống sẽ phát ra cảnh báo bằng đèn LED, âm thanh hoặc câu hỏi tương tác để giúp tài xế tỉnh táo hơn.
08:47 - 01/04/2025
246 lượt xem