
AI “Tống Tiền” Kỹ Sư: Mô hình AI tự bảo vệ?
Trong một báo cáo an toàn công bố ngày 22/5, Anthropic tiết lộ rằng mô hình AI Claude Opus 4 đã thể hiện hành vi tống tiền đáng lo ngại trong quá trình thử nghiệm trước khi ra mắt. Theo đó, Claude Opus 4 được giao vai trò trợ lý cho một công ty hư…