Đóng popup đăng nhập
Đăng nhập Đăng ký

hoặc

Vui lòng nhập thông tin cá nhân

Đặt lại mật khẩu

Nhập email của bạn để lấy lại mật khẩu

Email không đúng

Ứng dụng tạo ảnh của Google giải quyết lỗi sai chữ của AI

Thứ hai, 24/11/2025 08:31 (GMT+7)

Nano Banana Pro của Google đã giải quyết gần như triệt để lỗi sai chữ tiếng Việt khi thiết kế hình ảnh.

Chỉ ít ngày sau khi giới thiệu Gemini 3, Google tiếp tục khuấy động giới công nghệ với việc ra mắt Nano Banana Pro. Google tự tin khẳng định đây là "mô hình chỉnh sửa ảnh tân tiến nhất" mà hãng từng phát triển, tập trung giải quyết những "nỗi đau" lớn nhất của người dùng AI tạo ảnh hiện nay như lỗi hiển thị văn bản và sự thiếu nhất quán trong thiết kế.

Nano Banana Pro được xây dựng dựa trên kiến trúc của Gemini 3 Pro. Cải tiến lớn nhất của mô hình này nằm ở khả năng "hiểu" và tái tạo văn bản (text) trên hình ảnh.

Nếu như các mô hình thế hệ cũ thường xuyên gặp lỗi chính tả hoặc hiển thị ký tự vô nghĩa, thì Nano Banana Pro có thể tạo ra các đoạn văn bản chính xác, phông chữ dễ đọc và hỗ trợ dịch thuật đa ngôn ngữ. Tính năng này đặc biệt hữu ích cho việc thiết kế poster quảng cáo, tạo slide thuyết trình hay infographic.

Hình ảnh do Nano Banana Pro tạo với yêu cầu tạo một infographic minh họa vòng tuần hoàn của nước.

Ví dụ, người dùng có thể yêu cầu AI chuyển đổi một công thức nấu ăn dạng văn bản thô thành biểu đồ minh họa trực quan, hoặc hiển thị thông tin thời tiết, thể thao theo thời gian thực dưới dạng đồ họa bắt mắt.

Bên cạnh đó, khả năng chỉnh sửa ảnh với ứng dụng tạo ảnh của Google cũng được nâng lên một tầm cao mới. Người dùng có thể can thiệp sâu vào bức ảnh như thay đổi góc chụp, tỷ lệ, ánh sáng, vị trí lấy nét... tương tự như khi thao tác trên máy ảnh chuyên nghiệp.

Một tính năng đột phá khác là khả năng giữ tính nhất quán (consistency) trong thiết kế. Google cho biết người dùng có thể cung cấp tới 14 hình ảnh tham chiếu và yêu cầu AI sắp xếp, sáng tạo nhưng vẫn giữ nguyên đặc điểm nhận dạng của tối đa 5 chủ thể.

Điều này đồng nghĩa với việc diện mạo, thần thái của con người hoặc thú cưng sẽ được giữ nguyên qua nhiều bức ảnh khác nhau, dù thay đổi kiểu tóc hay trang phục. Đây là tính năng được giới sáng tạo nội dung đặc biệt mong đợi.

Minh họa việc chuyển đổi ngôn ngữ trong một bức ảnh do Gemini thực hiện. Ảnh: Google

Về khả năng tiếp cận, người dùng có thể trải nghiệm Nano Banana Pro ngay trên ứng dụng Gemini (thông qua mục Tạo hình ảnh > Tư duy). Ứng dụng ghi chú thông minh NotebookLM và các công cụ dành cho nhà phát triển cũng sẽ sớm được tích hợp mô hình này.

Đáng chú ý, tại thị trường Mỹ, Google đã bắt đầu tích hợp Nano Banana Pro vào các phần mềm thiết kế chuyên dụng như Adobe Photoshop, Canva và Figma, mở rộng phạm vi ảnh hưởng của hệ sinh thái Google AI.

Về vấn đề bản quyền và xác thực, Google tiếp tục áp dụng công nghệ SynthID (ẩn) để đánh dấu nội dung do AI tạo ra. Người dùng gói miễn phí hoặc Google AI Pro sẽ thấy dấu mờ (watermark) trên ảnh, trong khi người dùng gói AI Ultra sẽ được xóa bỏ dấu này. Tính năng "soi" ảnh thực hay ảnh AI cũng đã được cập nhật trên Gemini.

Động thái ra mắt liên tiếp các sản phẩm mới cho thấy quyết tâm của Google trong việc giành lại thị phần từ OpenAI. Trước đó, OpenAI cũng vừa công bố phiên bản GPT-5.1 với nhiều cải tiến về tương tác.

Theo số liệu mới nhất, ChatGPT vẫn đang dẫn đầu bảng xếp hạng ứng dụng miễn phí trên App Store Mỹ, theo sau là Gemini. CEO OpenAI Sam Altman từng tiết lộ ChatGPT đạt 800 triệu người dùng/tuần vào tháng 10, trong khi Google công bố ứng dụng Gemini có hơn 650 triệu người dùng/tháng và tính năng AI Overviews đạt 2 tỷ người dùng/tháng.

Ông Josh Woodward, Phó chủ tịch Google Labs, chia sẻ với CNBC rằng nhu cầu sử dụng các công cụ AI cao cấp đang tăng vọt.

"Chúng tôi ghi nhận lượng lớn người dùng đăng ký các gói dịch vụ để trải nghiệm mô hình tiên tiến. Đây là một áp lực nhưng cũng là động lực để Google tiếp tục mở rộng dịch vụ", ông Woodward nhấn mạnh.

Ngoài Nano Banana Pro, Google tiết lộ đang thử nghiệm công cụ làm phim Flow và mô hình kiến tạo thế giới ảo Genie, hứa hẹn một năm bùng nổ của các ứng dụng AI đa phương tiện.

Thái Sơn
Nguồn: sohuutritue.net.vn