TS. Việt: Hành trình 4 ngày kỳ diệu tạo AI giải Toán Olympic

Tiến sĩ Lương Minh Thắng, 38 tuổi, hiện là chuyên gia cao cấp tại bộ phận nghiên cứu trí tuệ nhân tạo Google DeepMind, nơi anh đã gắn bó gần một thập kỷ. Trong suốt thời gian làm việc tại Google, anh đã đóng góp vào việc xây dựng nhiều mô hình AI, trong đó có Gemini.

Một thành tựu nổi bật của anh và đội ngũ là phát triển AI Deep Think, tích hợp trong Gemini. Deep Think được thiết kế đặc biệt để giải quyết các bài toán phức tạp, tương tự như các bài toán trong kỳ thi Olympic Toán quốc tế (IMO). Nhóm phát triển do Lương Minh Thắng đứng đầu, bao gồm hàng chục chuyên gia của Google. Deep Think đã trải qua hai buổi thi kéo dài 4,5 tiếng, hoàn toàn độc lập, không sử dụng công cụ hỗ trợ hay Internet. Kết quả, AI này đạt 35/42 điểm ở 5 câu hỏi đầu tiên, được chính giám khảo của IMO chấm. Đáng chú ý, trong kỳ thi IMO năm đó, chỉ có 67 trên tổng số 630 thí sinh đạt từ 35 điểm trở lên, mức điểm tương đương huy chương vàng.

Chia sẻ về động lực thúc đẩy việc phát triển một AI có khả năng giải toán, Tiến sĩ Thắng cho biết ý tưởng này đến một cách tự nhiên. Vào cuối năm 2022, ChatGPT ra đời, và đầu năm 2023, Google giới thiệu Bard (sau này đổi tên thành Gemini). Mặc dù ChatGPT và Gemini đều xuất sắc trong lĩnh vực ngôn ngữ tự nhiên, nhưng chúng vẫn bị giới hạn trong việc bắt chước ngôn ngữ của con người. Do đó, nhóm nghiên cứu đã đặt ra câu hỏi: “Tại sao không trang bị cho Gemini khả năng tư duy, lý luận cao cấp hơn?”. Toán học được xem là lĩnh vực phù hợp để phát triển khả năng này của AI.

Với niềm đam mê toán học từ nhỏ, từng tham gia thi toán quốc gia khi còn học cấp ba, Tiến sĩ Thắng đã thành lập một nhóm mới tại Google vào năm 2024 với tên gọi “Lý luận siêu trí tuệ”. Mục tiêu của nhóm là phát triển AI có khả năng suy luận sâu sắc và hạn chế tình trạng “ảo giác”, tức đưa ra thông tin sai lệch nhưng nghe có vẻ thuyết phục. Bằng cách tiếp cận toán học, nhóm muốn dạy AI cách lý luận chặt chẽ và từng bước một.

Trước Deep Think, Google đã có hai mô hình là AlphaGeometry 2 (ngang trình độ huy chương vàng IMO) và AlphaProof (ngang trình độ huy chương bạc IMO). Tuy nhiên, cả hai mô hình này đều cần sự can thiệp của con người trong một số công đoạn. Ngược lại, Deep Think thực hiện gần như toàn bộ quá trình nhờ công nghệ suy luận song song, cho phép mô hình khám phá và kết hợp nhiều hướng giải khác nhau trước khi đưa ra câu trả lời. AI này được huấn luyện bằng kỹ thuật học tăng cường mới, sử dụng dữ liệu chuyên sâu về lập luận, giải quyết vấn đề và chứng minh định lý.

Tiến sĩ Lương Minh Thắng. Ảnh: Bảo Lâm
TS. Lương Minh Thắng: Chân dung và sự nghiệp. Ảnh: Internet

Để huấn luyện Deep Think, nhóm nghiên cứu đã thu thập một lượng lớn dữ liệu, bao gồm cả các kỳ thi toán trên toàn thế giới. Thay vì chỉ sử dụng dữ liệu đáp án như các mô hình trước đây, nhóm tập trung vào dữ liệu thể hiện trình độ lý luận chặt chẽ. Nhóm cũng đã liên hệ với khoảng 30 người từng đoạt huy chương ở các kỳ thi toán học, bao gồm cả các chuyên gia từ Việt Nam, như thầy Trần Nam Dũng.

Tiến sĩ Thắng chia sẻ về khoảnh khắc đáng nhớ trong quá trình phát triển Deep Think, đó là “bốn ngày kỳ diệu” ngay trước kỳ thi IMO 2025. Nhóm đã có một hệ thống AI sẵn sàng tham gia kỳ thi, nhưng muốn mô hình trở nên tốt hơn nữa. Tuy nhiên, việc thay đổi cấu hình đòi hỏi rất nhiều tài nguyên tính toán mà Google không có đủ vào thời điểm đó. Sau khi thuyết phục CEO DeepMind Demis Hassabis và các lãnh đạo cấp cao, anh đã được chấp thuận cung cấp thêm tài nguyên.

Tuy nhiên, việc hiện thực hóa ý tưởng trong một tuần là một áp lực lớn. Trong bốn ngày ngắn ngủi, nhóm đã chạy hệ thống với sự quyết tâm cao độ. Ở phiên bản mới, các công thức được đặt chung nhau, thay vì riêng lẻ như trước đây. May mắn thay, mọi thứ diễn ra suôn sẻ và thành công ngoài mong đợi. Deep Think không chỉ giải toán tốt mà còn có thể tự tư duy lập trình, tìm kiếm kiến thức chuyên sâu.

Khi so sánh Deep Think với mô hình của OpenAI (cũng đạt huy chương vàng IMO 2025), Tiến sĩ Thắng nhấn mạnh rằng Deep Think hiển thị toàn bộ quá trình tính toán, minh bạch về cách AI tư duy từng bước. Quan trọng hơn, mô hình của Google đã được triển khai cho công chúng sử dụng.

Nếu ví Deep Think như một học sinh, Tiến sĩ Thắng cho rằng trước đây nó là một học sinh cần cù, kiên trì. Còn hiện tại, nó là một học sinh sáng tạo, có thể tạo ra những cách giải mới mà đôi khi chính đội ngũ cũng bất ngờ.

Về xu hướng tạo ra nhiều mô hình AI chuyên sâu, Tiến sĩ Thắng cho rằng đây là một vấn đề cần suy ngẫm. AI có thể là con dao hai lưỡi. Nếu học sinh lười biếng, AI có thể bị lạm dụng, làm giảm sự tư duy. Nhưng nếu ở trong tay học sinh có khả năng sáng tạo, AI sẽ chắp cánh cho những ý tưởng mới. Ông cũng nhấn mạnh sự cần thiết của việc thay đổi cách giảng dạy ở Việt Nam để thích ứng với sự phát triển nhanh chóng của AI.

Nhận thấy tiềm năng của giới trẻ Việt Nam, Tiến sĩ Thắng và hai cộng sự ở Thung lũng Silicon đã thành lập tổ chức phi lợi nhuận New Turing Institute. Mục tiêu của tổ chức là nuôi dưỡng và truyền cảm hứng cho thế hệ tài năng AI tiếp theo ở Đông Nam Á và những nơi khác, thông qua các chương trình đào tạo, tài trợ và cuộc thi. Ông hy vọng tổ chức sẽ góp phần đưa Việt Nam trở thành trung tâm công nghệ hàng đầu trên thế giới.

Về định hướng nghề nghiệp cho người trẻ, Tiến sĩ Thắng dự đoán rằng AI sẽ đóng góp rất lớn trong các lĩnh vực quan trọng như khoa học, y tế và nghiên cứu. Với robot hình người, ông bày tỏ sự lo lắng, nhưng vẫn hướng đến những mặt tích cực mà chúng có thể mang lại.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *