AI Google giải quyết thách thức: Tạo chữ trong ảnh

Google vừa công bố phiên bản nâng cấp Nano Banana Pro, được xây dựng dựa trên nền tảng Gemini 3 Pro, hứa hẹn mang đến khả năng tạo hình ảnh vượt trội so với phiên bản cũ và các mô hình AI phổ biến khác. Điểm nổi bật của Nano Banana Pro là khả năng tạo ra chữ viết chính xác trong hình ảnh, khắc phục nhược điểm thường thấy ở các AI khác vốn chỉ tạo ra những hình ảnh “giống chữ” nhưng vô nghĩa.

Minh họa việc chuyển đổi ngôn ngữ trong một bức ảnh do Gemini thực hiện. Ảnh: Google
Gemini AI: Chuyển đổi ngôn ngữ trong ảnh minh họa. Ảnh: Internet

Theo Google, Nano Banana Pro có thể tạo ra những hình ảnh đẹp hơn với phần chữ chính xác, dễ đọc và hiển thị trực tiếp bằng nhiều ngôn ngữ khác nhau. Hãng khẳng định đây là mô hình tốt nhất hiện nay trong việc tạo hình ảnh chứa văn bản chính xác, dù là đoạn ngắn hay dài.

Để sử dụng, người dùng chỉ cần truy cập Gemini trên điện thoại hoặc máy tính, chọn công cụ “Tạo hình ảnh” (biểu tượng quả chuối) và nhập câu lệnh. Các thử nghiệm cho thấy AI này có khả năng tạo ra những hình ảnh chuẩn chứa văn bản tiếng Việt một cách dễ dàng. Google giải thích rằng, Nano Banana Pro tận dụng khả năng lập luận nâng cao của Gemini 3, kết hợp với kho tri thức từ Google Search để giúp người dùng tạo ra các hình minh họa một cách nhanh chóng.

Hình ảnh Nano Banana Pro tạo ra với câu lệnh: Tưởng tượng bạn là thầy giáo dạy kỹ năng sống, hãy tạo infographic hướng dẫn cách rán trứng, để trẻ 10 tuổi cũng hiểu và thích thú làm theo.
Nano Banana Pro: Infographic rán trứng cho trẻ em từ AI. Ảnh: Internet

Nhờ vậy, công cụ này có thể được ứng dụng rộng rãi trong việc tạo ra các đồ họa như infographic, biển quảng cáo, sơ đồ minh họa, bản ghi chú, công thức nấu ăn… Người dùng chỉ cần nhập câu lệnh và thông tin cần thiết, Nano Banana Pro sẽ kết hợp với dữ liệu thu thập được để tạo hình ảnh và có thể thay đổi ngôn ngữ theo yêu cầu.

Một điểm cải tiến đáng chú ý khác của Nano Banana Pro là khả năng kết hợp nhiều dữ liệu đầu vào. Người dùng có thể cung cấp tối đa 14 hình ảnh tham khảo và yêu cầu AI tạo ra một thiết kế tương đồng. Bên cạnh đó, mô hình này cũng đảm bảo sự đồng nhất và giữ được nét giống nhau của tối đa 5 nhân vật trong ảnh, giúp việc nhận diện trở nên liền mạch và nhất quán hơn. Chất lượng hình ảnh đầu ra có thể đạt độ phân giải 2K hoặc 4K.

Trước những lo ngại về khả năng AI bị lợi dụng để tạo ra các nội dung sai lệch, Google cho biết đã nâng cấp hệ thống xác định hình ảnh được tạo ra bằng AI trong ứng dụng Gemini. Tất cả nội dung do công cụ của Google tạo ra đều được gắn SynthID – một ký hiệu kỹ thuật số ẩn.

Để xác minh một bức ảnh có phải do AI của Google tạo ra hay không, người dùng có thể tải ảnh lên ứng dụng Gemini và đặt câu hỏi. Đại diện Google cho biết hãng sẽ sớm mở rộng tính năng này sang âm thanh và video. Google cũng duy trì ký hiệu mờ (watermark) trên ảnh được tạo bởi người dùng gói miễn phí và Google AI Pro, trong khi gói Google AI Ultra dành cho người dùng chuyên nghiệp sẽ không có watermark.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *