OpenAI vừa công bố một bước tiến đáng kể trong lĩnh vực trí tuệ nhân tạo khi mô hình ngôn ngữ lớn (LLM) của họ đã xuất sắc vượt qua kỳ thi Olympic Toán quốc tế (IMO), một trong những cuộc thi toán học danh giá và khó khăn nhất thế giới. Thông tin này được Alexander Wei, thành viên đội ngũ kỹ thuật OpenAI, chia sẻ trên mạng xã hội X.
Theo bài đăng trên blog của Wei, mô hình LLM đã tham gia một phiên bản mô phỏng kỳ thi IMO 2025, bao gồm sáu bài toán hóc búa. Mô hình này phải trải qua hai buổi thi, mỗi buổi kéo dài 4,5 tiếng với ba bài toán, hoàn toàn không có sự hỗ trợ của công cụ hay Internet, đồng thời phải đọc đề và giải bằng ngôn ngữ tự nhiên, tương tự như điều kiện thi thực tế.

Wei nhấn mạnh rằng, mục tiêu của thử nghiệm này là đánh giá khả năng tư duy sáng tạo của LLM so với các tiêu chuẩn trước đây. Việc mô hình có thể viết lời giải chi tiết giúp quá trình kiểm tra thông tin trở nên dễ dàng hơn, đồng thời xác định được khả năng xây dựng các lập luận phức tạp và chặt chẽ ở cấp độ của một nhà toán học thực thụ. Ngoài ra, cách tiếp cận không đi theo lối mòn, mà tập trung vào mục tiêu chung, sẽ giúp mô hình tạo ra đột phá trong học tăng cường và khả năng mở rộng tính toán theo thời gian.
Kết quả cuối cùng cho thấy mô hình đã giải thành công 5 trên 6 bài toán. Các bài giải được một hội đồng giám khảo gồm ba cựu thí sinh đoạt huy chương IMO chấm điểm độc lập. Tổng điểm mà mô hình của OpenAI đạt được là 35/42, đủ tiêu chuẩn để giành huy chương vàng.
Kỹ sư Noam Brown của OpenAI cũng chia sẻ rằng, các bài toán trong kỳ thi IMO đòi hỏi khả năng tư duy sáng tạo bền bỉ, vượt xa các tiêu chuẩn thông thường. Mô hình LLM của họ đã chứng minh được khả năng suy nghĩ và giải quyết vấn đề trong một khoảng thời gian dài.
Tuy nhiên, Alexander Wei cũng lưu ý rằng, đây chỉ là một mô hình nghiên cứu thử nghiệm và OpenAI chưa có kế hoạch phát hành bất kỳ sản phẩm nào có khả năng toán học tương đương trong tương lai gần.
CEO của OpenAI, Sam Altman, cũng khẳng định trên X rằng đây là một chương trình LLM chuyên về toán học, không phải một hệ thống toán học chính thức cụ thể. Mô hình này là một phần trong nỗ lực của OpenAI nhằm hướng tới trí thông minh tổng quát (AGI).
Kỳ thi IMO, bắt nguồn từ Romania vào năm 1959, là một trong những kỳ thi khó khăn nhất thế giới, dành cho học sinh dưới 20 tuổi. Các bài toán trong kỳ thi được lựa chọn từ các lĩnh vực toán học sơ cấp, bao gồm hình học, số học, đại số và tổ hợp.
Theo Business Insider, thành tựu mới này của OpenAI cho thấy sự tiến bộ vượt bậc trong khả năng giải toán của AI, đánh dấu một bước tiến quan trọng trong lĩnh vực tư duy toán học và sáng tạo của công nghệ. Năm ngoái, các phòng thí nghiệm AI chủ yếu sử dụng các bài toán ở cấp độ tiểu học để đánh giá mô hình trí tuệ nhân tạo. Tỷ phú Peter Thiel từng dự đoán vào năm 2024 rằng phải mất ít nhất ba năm nữa AI mới có thể giải được các bài toán IMO.
Admin
Nguồn: VnExpress