Mới đây, mô hình trí tuệ nhân tạo (AI) Deep Think của Google đã đạt được thành tích ấn tượng trong việc giải các bài toán Olympic Toán học Quốc tế (IMO). Trong điều kiện mô phỏng kỳ thi thật, với thời gian 4,5 giờ cho hai buổi thi và không sử dụng Internet hay công cụ hỗ trợ, Deep Think đã giành được 35/42 điểm ở 5 câu hỏi đầu tiên. Điều đáng chú ý, kết quả này được chính các giám khảo của IMO trực tiếp chấm. Theo thống kê của kỳ thi IMO năm nay, chỉ có 67 trên tổng số 630 thí sinh đạt được từ 35 điểm trở lên, mức điểm thường tương ứng với huy chương vàng.
Giáo sư Gregor Dolinar, Chủ tịch IMO, đã đánh giá cao thành tích này: “Chúng tôi xác nhận Google DeepMind đã đạt được một cột mốc quan trọng. Lời giải của AI rất đáng chú ý ở nhiều khía cạnh. Các giám khảo IMO nhận xét rằng chúng rõ ràng, chính xác và dễ hiểu.”
Deep Think là phiên bản nâng cấp của mô hình AI Gemini, được thiết kế đặc biệt để giải quyết các bài toán phức tạp như trong kỳ thi IMO. Điểm nổi bật của Deep Think nằm ở khả năng tư duy song song. Thay vì đi theo một chuỗi suy luận tuyến tính như các mô hình truyền thống, nó có thể đồng thời khám phá và kết hợp nhiều hướng giải khác nhau trước khi đưa ra câu trả lời cuối cùng.

Để tối ưu hóa khả năng suy luận của Deep Think, nhóm nghiên cứu đã áp dụng kỹ thuật học tăng cường mới, sử dụng dữ liệu chuyên sâu về lập luận đa bước, giải quyết vấn đề và chứng minh định lý. Bên cạnh đó, mô hình còn được cung cấp một kho dữ liệu chọn lọc bao gồm các lời giải toán học chất lượng cao, cùng với các mẹo và chiến lược tổng quát để tiếp cận bài toán IMO một cách hiệu quả.
Google nhấn mạnh rằng đây là một bước tiến đáng kể so với các mô hình trước đây. Năm ngoái, AlphaGeometry 2 của Google cũng đã giải đúng 42/50 bài hình học trong các kỳ IMO trong vòng 25 năm qua, tương đương với trình độ của thí sinh đoạt huy chương vàng (40,9 bài). Một mô hình khác, AlphaProof, cũng đạt điểm tuyệt đối 4 trong 6 bài của kỳ thi IMO 2024, giành được 28/42 điểm, tương đương với thí sinh đoạt huy chương bạc.
Google bày tỏ niềm tin rằng việc kết hợp khả năng ngôn ngữ tự nhiên lưu loát với khả năng lập luận chặt chẽ sẽ tạo ra những công cụ vô giá cho các nhà toán học, khoa học, kỹ sư và nhà nghiên cứu. Điều này sẽ giúp nâng cao kiến thức của nhân loại trên con đường hướng tới trí tuệ nhân tạo toàn diện.
Cũng trong tuần này, OpenAI, công ty phát triển ChatGPT, đã giới thiệu một mô hình ngôn ngữ lớn (LLM) thử nghiệm có khả năng giải đúng 5 trên 6 câu hỏi của đề thi IMO 2025, tương đương với trình độ của thí sinh đoạt huy chương vàng, cho thấy sự tiến bộ vượt bậc của AI trong lĩnh vực giải toán.
Admin
Nguồn: VnExpress