Trong sự kiện ra mắt Gemini 3 vào rạng sáng ngày 19/11 (giờ Hà Nội), CEO Google Sundar Pichai đã nhấn mạnh bước tiến vượt bậc của trí tuệ nhân tạo (AI) chỉ trong vòng hai năm, từ khả năng đọc hiểu văn bản và hình ảnh đơn thuần đến khả năng thấu hiểu các tình huống phức tạp.
Gemini 3 là mô hình AI mới nhất của Google, tiếp nối các phiên bản Gemini 1, 2 và 2.5 trước đó. Theo ông Pichai, thế hệ đầu tiên của Gemini tập trung vào khả năng xử lý ngữ cảnh dài, trong khi thế hệ thứ hai đặt nền móng cho các tác nhân AI và tăng cường khả năng lập luận, tư duy. Gemini 3 được xem là mô hình thông minh nhất của Google, tích hợp toàn bộ những năng lực ưu việt của các phiên bản trước.
Đại diện Google cho biết, Gemini 3 sở hữu khả năng lập luận tiên tiến, cho phép nắm bắt những ý nghĩa sâu sắc và tinh tế, bao gồm việc “nhận ra các gợi ý nhỏ nhất trong một ý tưởng sáng tạo” hoặc phân tích các lớp chồng chéo của một vấn đề phức tạp. Điều này giúp người dùng nhận được câu trả lời thỏa đáng hơn chỉ với một vài câu lệnh.
Theo CEO Google DeepMind Demis Hassabis, phiên bản thử nghiệm đầu tiên của thế hệ mới, Gemini 3 Pro, vượt trội hơn so với bản 2.5 Pro trên mọi công cụ đánh giá. Trên bảng xếp hạng LMArena, mô hình này đạt điểm số 1501 và thể hiện năng lực lập luận ở trình độ tiến sĩ theo phép đo của Humanity’s Last Exam.
Bên cạnh việc công bố những kết quả vượt trội so với GPT-5.1 của OpenAI, Google cũng khẳng định rằng các phản hồi của Gemini 3 “thông minh, súc tích và trực diện”, thay thế những lời lẽ sáo rỗng bằng những góc nhìn giá trị và chân thực. Đây được xem là một lời đáp trả đối với GPT mới của OpenAI, vốn bị cho là “quá nịnh hót”.

Ông Hassabis cũng nhấn mạnh rằng Gemini 3 được nâng cao khả năng lập luận, năng lực đọc hiểu hình ảnh và không gian, hiệu năng đa ngôn ngữ tốt cùng khả năng xử lý cửa sổ ngữ cảnh tối đa một triệu token đầu vào.
Trong một ví dụ minh họa, khi được yêu cầu học cách nấu ăn theo công thức gia truyền, Gemini 3 có thể giải mã và dịch các công thức viết tay sang nhiều ngôn ngữ khác nhau, sau đó tạo ra một cuốn sổ tay nấu ăn để người dùng có thể chia sẻ với nhau.

Google cho biết thêm, người dùng có thể cung cấp cho Gemini các bài nghiên cứu học thuật, video bài giảng dài hoặc các khóa hướng dẫn để mô hình này chuyển đổi thành các thẻ tương tác, giúp người dùng dễ dàng tiếp thu kiến thức. AI cũng có thể phân tích video trận pickleball để xác định những điểm cần cải thiện và lên kế hoạch luyện tập nâng cao kỹ thuật.
Cùng với Gemini 3, Google cũng giới thiệu nền tảng phát triển tác nhân AI là Google Antigravity, đồng thời trình diễn việc tích hợp mô hình mới vào các sản phẩm hiện có như Search và AI Mode. Đây là lần đầu tiên một mô hình AI của Google được đưa vào sản phẩm ngay sau khi ra mắt. Trước đó, Gemini thế hệ đầu tiên được giới thiệu vào tháng 12/2023 và chính thức ra mắt thị trường vào đầu năm sau đó.
Theo CEO Sundar Pichai, Gemini là một trong những dự án khoa học và phát triển sản phẩm quy mô lớn nhất trong lịch sử của Google. Một số ứng dụng của AI này, như công cụ AI Overviews, hiện có hai tỷ người dùng mỗi tháng, và ứng dụng Gemini đã vượt mốc 650 triệu người dùng hàng tháng. Hơn 70% khách hàng Cloud của Google cũng đang sử dụng AI, và 13 triệu nhà lập trình đã phát triển sản phẩm với các mô hình tạo sinh của hãng.
Admin
Nguồn: VnExpress
