AI Tự Lập Trình 30 Tiếng: Bước Đột Phá Mới?

Theo công bố ngày 29/9 của Anthropic, Claude Sonnet 4.5 có khả năng hoạt động độc lập liên tục trong 30 giờ, tập trung vào các tác vụ phức tạp và đa bước. Ông Jared Kaplan, nhà đồng sáng lập kiêm Giám đốc Khoa học của Anthropic, đã chia sẻ thông tin này.

Khả năng viết code của Sonnet 4.5 so với các mô hình AI hàng đầu, theo bảng xếp hạng tiêu chuẩn SWE-bench Verified.
So sánh khả năng viết code: Sonnet 4.5 đấu với các AI hàng đầu. Ảnh: Internet

Đáng chú ý, phiên bản AI mới này đạt thời gian viết code liên tục gần gấp 5 lần so với phiên bản trước đó, Claude Opus 4, với thời gian tối đa là 7 tiếng. Claude Sonnet 4.5 được đánh giá là vượt trội về nhiều mặt, bao gồm khả năng mã hóa, tự sử dụng máy tính và đáp ứng các nhu cầu kinh doanh thực tế. Đặc biệt, nó thể hiện sự vượt trội trong các lĩnh vực chuyên môn như an ninh mạng, tài chính và nghiên cứu.

Trong quá trình lập trình, Claude Sonnet 4.5 có khả năng chống lại các cuộc tấn công “tiêm” mã độc một cách nhanh chóng. Đây là một hình thức tấn công mà AI có thể bị lợi dụng để thực hiện các hành vi độc hại, chẳng hạn như tiết lộ dữ liệu nhạy cảm. Khả năng này được xem là một bước tiến mới trong lĩnh vực tác nhân AI (AI Agent) tự lập trình.

Ông Kaplan khẳng định Claude Sonnet 4.5 là “mô hình viết code tốt nhất thế giới”, đáp ứng tiêu chuẩn SWE-bench Verified, một bộ thử nghiệm đo lường khả năng viết phần mềm của hệ thống AI. Trên OSWorld, một chuẩn kiểm tra các mô hình AI trong các tác vụ máy tính thực tế, Sonnet 4.5 cũng dẫn đầu với tỷ lệ 61,4%.

“Mọi người sẽ thấy mô hình này thông minh hơn, giống như một đồng nghiệp hơn, đặc biệt ở khả năng đối mặt và giải quyết các vấn đề phức tạp”, ông Kaplan nhận định.

Ông Mike Krieger, Giám đốc sản phẩm của Anthropic, cho biết Claude Sonnet 4.5 sẽ được cung cấp mặc định cho người dùng mà không cần cài đặt thêm. Tuy nhiên, người dùng vẫn có tùy chọn trả phí để sử dụng phiên bản cao cấp hơn.

Logo Claude của Anthropic trên một chiếc smartphone. Ảnh: Cnet
Logo Claude (Anthropic) trên Smartphone: Thiết kế AI độc đáo?. Ảnh: Internet

Sự ra mắt của Claude Sonnet 4.5 diễn ra chỉ một thời gian ngắn sau khi Anthropic công bố Claude Opus 4.1 vào tháng 8 và Claude Sonnet 4 vào tháng 5. Theo đánh giá của CNBC, điều này cho thấy tốc độ đổi mới chóng mặt trong lĩnh vực AI, đặc biệt là AI Agent.

Ông Krieger cũng cho biết thêm rằng mặc dù Claude Sonnet 4.5 có sức mạnh lớn, công ty vẫn còn “một vài điều cần thực hiện”, chẳng hạn như cải thiện mô hình AI để giúp mọi người cảm thấy thoải mái hơn và thích nghi với quy trình làm việc. Anthropic dự kiến sẽ sớm ra mắt phiên bản Opus mới vào cuối năm nay, cho phép người dùng tùy chọn sử dụng song song giữa Sonnet và Opus cho các công việc khác nhau.

Anthropic hiện là một trong những công ty hàng đầu trong việc phát triển AI Agent, có khả năng thực hiện các nhiệm vụ phức tạp thay cho người dùng, đặc biệt là để hợp lý hóa quy trình viết code và gỡ lỗi. Công ty hiện được định giá 183 tỷ USD và đạt doanh thu 5 tỷ USD theo công bố hồi tháng 8, được xem là một đối thủ đáng gờm của OpenAI, Google và các công ty trí tuệ nhân tạo lớn khác trên toàn cầu.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *