AI Trung Quốc thua Mỹ ở cờ vua: Phân tích thất bại

Tại vòng tứ kết diễn ra vào sáng 6/8, cả bốn trận đấu đều kết thúc với tỷ số áp đảo 4-0, trong đó chiến thắng của o3 trước Kimi K2 là trận đấu có sự chênh lệch lớn nhất. Điều đáng chú ý là cả bốn ván đấu giữa o3 và Kimi K2 đều kết thúc chóng vánh, không quá tám nước đi, do Kimi K2 liên tục mắc lỗi khi đi những nước cờ không hợp lệ.

o3 là một trong những Large Language Models (LLMs) được sử dụng cho chatbot nổi tiếng ChatGPT của OpenAI (Mỹ). Trong khi đó, Kimi K2 là mô hình đến từ Moonshot AI, một công ty có trụ sở tại Trung Quốc.

Thế cờ sau nước 8...Qxe5. Lúc này, AI của Trung Quốc (quân trắng) lần lượt đi bốn nước, là 9.Kf2, 9.Ke2, 9.Nxe5 và 9.Nxe5, đều không hợp lệ. Trong thế cờ này, chỉ có sáu nước cờ hợp lệ cho trắng, là chạy vua lên d2 hoặc đưa hậu, tượng và mã sang cột e để chắn nước chiếu.
Sai lầm của AI Trung Quốc trong cờ vua: Phân tích nước đi 8…Qxe5. Ảnh: Internet

Ví dụ, ở ván thứ ba, o3 cầm quân đen và thực hiện nước đi đưa hậu lên vị trí e5 để chiếu tướng ở nước thứ tám. Kimi K2 nhận thức rõ vị trí của tất cả các quân cờ và hiểu rằng cần phải di chuyển vua hoặc đỡ nước chiếu. Tuy nhiên, trong cả bốn lần thử, Kimi K2 đều đi những nước cờ không tuân thủ luật chơi, dẫn đến việc bị xử thua.

Trong trận đấu này, tỷ lệ nước đi của o3 trùng khớp với công cụ đánh cờ Stockfish lần lượt là 96,5%, 95,1%, 100% và 100%. Mặc dù vậy, thông số này không thực sự mang nhiều ý nghĩa do Kimi K2 đã thất bại quá nhanh chóng.

Một đại diện khác của Trung Quốc tham gia giải đấu là Deepseek, mô hình của công ty cùng tên đặt trụ sở tại Hàng Châu, Chiết Giang. Deepseek đã thể hiện tốt hơn so với Kimi K2, nhưng vẫn phải chịu thất bại 0-4 trước o4-mini của OpenAI.

Chiến thắng của Grok 4 (xAI) trước Gemini 2.5 Flash (Google)
Grok 4 (xAI) thắng Gemini 2.5 Flash (Google): So sánh AI đối thủ. Ảnh: Internet

Ván đầu tiên giữa Deepseek và o4-mini kéo dài 28 nước đi trước khi Deepseek mắc lỗi đi quân sai luật lần thứ tư. Ở ván thứ hai, o4-mini đã chiếu hết đối thủ chỉ sau 17 nước đi. Hai ván còn lại kết thúc sau 25 và 26 nước đi, với đại diện của Mỹ chiếu hết đối thủ ở ván cuối cùng.

Trong khi các mô hình tạo nên ChatGPT tỏa sáng, Grok 4, mô hình của công ty xAI thuộc sở hữu của tỷ phú Elon Musk, lại là cái tên gây ấn tượng mạnh nhất ở vòng tứ kết. Grok 4 có thể được sử dụng để tương tác như một chatbot trên X (trước đây là Twitter) cho những người dùng trả phí. Đối thủ của Grok 4 là Gemini 2.5 Flash, một sản phẩm của Google.

Mô hình của Elon Musk đã giành chiến thắng tuyệt đối trong cả bốn ván đấu, trừng phạt mọi sai lầm của đối thủ, chẳng hạn như việc để mất quân. Tỷ lệ chính xác trong các nước đi của Grok 4 lần lượt là 77,8%, 97,5%, 94,4% và 94,8%, cao nhất trong số các trận đấu, nếu không tính trận o3 và Kimi K2.

Kỳ thủ số hai thế giới, Hikaru Nakamura, cũng bày tỏ sự ấn tượng với các nước cờ của Grok 4 khi bình luận về ván đấu. Anh nhận xét: “Chắc chắn Grok 4 là LLM đánh cờ mạnh nhất giải này. Sự chênh lệch trình độ giữa nó và các mô hình khác là không hề nhỏ. Chắc chắn ông Musk sẽ khoe khoang chiến thắng này trên Twitter”.

Sau đó, Elon Musk đã chia sẻ lại một bài đăng có hình ảnh Nakamura đang bình luận trực tuyến, kèm theo lời bình luận: “Đây chỉ là tác dụng phụ thôi. xAI hầu như không dành chút thời gian nào cho cờ vua cả”.

Mặc dù Gemini 2.5 Flash đã bị loại, Google vẫn còn một đại diện khác tại giải đấu, đó là Gemini 2.5 Pro, với chiến thắng 4-0 trước Claude 4 Opus. Claude là mô hình của công ty Anthropic, có trụ sở tại San Francisco, California. Claude đã chơi khá tốt khi cầm cự được khoảng 30 nước trong cả bốn ván đấu, nhưng Gemini 2.5 Pro đơn giản là mạnh hơn.

Vòng bán kết sẽ diễn ra từ 0h30 thứ Năm, ngày 7/8 (giờ Hà Nội). Grok 4 sẽ đối đầu với Gemini 2.5 Pro. Trận bán kết còn lại sẽ là trận derby OpenAI giữa o3 và o4-mini.

Giải đấu này do Google tổ chức trên nền tảng Kaggle từ ngày 5/8 đến 7/8, quy tụ 8 LLMs tham gia đấu loại trực tiếp để tìm ra nhà vô địch.

LLMs là một loại mô hình trí tuệ nhân tạo (AI), chủ yếu được sử dụng để xử lý ngôn ngữ, dịch thuật hoặc sáng tạo nội dung. Người dùng có thể tương tác với LLMs thông qua các chatbot, chẳng hạn như ChatGPT của OpenAI. Về mặt kỹ thuật, LLMs hoạt động theo cách thức “đoán từ tiếp theo”.

Với những màn trình diễn ấn tượng, vòng bán kết hứa hẹn sẽ mang đến những trận đấu đỉnh cao và kịch tính, khẳng định vị thế của các mô hình AI hàng đầu trong lĩnh vực cờ vua.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *