Google ra mắt Gemini 3: Ngôi vương AI đổi chủ

08:40 | 20/11/2025

Hãng công nghệ Mỹ vừa công bố mô hình Gemini 3 Pro và phiên bản tư duy sâu Deep Think, với các chỉ số hiệu năng được khẳng định là cao hơn mô hình GPT-5.1 của OpenAI trong nhiều bài kiểm tra quan trọng.

AI thông minh hơn ChatGPT

Trong thông báo phát đi hôm nay, Google mô tả Gemini 3 Pro là bước tiến quan trọng nhất của hãng trên lộ trình hướng tới trí tuệ nhân tạo tổng quát (AGI). Ông Demis Hassabis, Giám đốc điều hành Google DeepMind, cho biết đây là mô hình mạnh nhất thế giới hiện tại về khả năng hiểu đa phương thức và xử lý tác vụ lập trình phức tạp.

Gemini 3 Pro được xây dựng dựa trên kiến trúc Transformer kết hợp với mô hình hỗn hợp chuyên gia thưa (MoE), được huấn luyện hoàn toàn trên hệ thống chip TPU do chính Google phát triển.

Dữ liệu từ nhà phát triển cho thấy phiên bản mới đã vượt qua thế hệ tiền nhiệm Gemini 2.5 Pro trên tất cả các tiêu chuẩn đánh giá hiệu năng. Cụ thể, trên bảng xếp hạng LMArena, Gemini 3 Pro đang dẫn đầu với 1.501 điểm Elo, tạo khoảng cách lớn với các nhóm phía sau.

Gemini 3 Pro dẫn đầu về điểm số hiệu năng trên thang đo LMArena. Ảnh: Google

Tại bài kiểm tra năng lực lập luận có độ khó cao mang tên "Humanity’s Last Exam" (Bài kiểm tra cuối cùng của nhân loại), mô hình đạt tỷ lệ chính xác 37,5%. Google đưa ra bảng so sánh trực tiếp cho thấy con số này cao hơn mức 26,5% của GPT-5.1, mô hình ngôn ngữ lớn mới nhất từ đối thủ OpenAI.

Bên cạnh phiên bản Pro, Google cũng giới thiệu biến thể chuyên biệt mang tên Gemini 3 Deep Think. Đây là phiên bản tập trung vào khả năng suy luận sâu, đạt điểm số 41% trong bài kiểm tra Humanity’s Last Exam và 93,8% ở thang đo GPQA Diamond. Đáng chú ý, trong bài đánh giá về trí tuệ nhân tạo tổng quát ARC-AGI, mô hình ghi nhận mức điểm 45,1%. Đại diện hãng cũng nhấn mạnh việc điều chỉnh phong cách phản hồi của AI. Thay vì các câu trả lời mang tính sáo rỗng hoặc khen ngợi người dùng quá mức, mô hình mới sẽ tập trung vào sự súc tích, trực diện và cung cấp các góc nhìn thực tế.

Khả năng hiểu được bối cảnh trong thế giới thực

Khả năng thấu hiểu bối cảnh thực tế là điểm nhấn công nghệ trên thế hệ Gemini thứ ba. Với cửa sổ ngữ cảnh lên tới 1 triệu token, hệ thống có thể tiếp nhận và xử lý khối lượng thông tin khổng lồ từ văn bản, hình ảnh, video, âm thanh đến mã nguồn cùng một lúc.

Ví dụ, người dùng có thể yêu cầu Gemini 3 dịch các công thức nấu ăn viết tay từ nhiều ngôn ngữ khác nhau, sau đó chuyển đổi thành sách hướng dẫn kỹ thuật số kèm hình ảnh minh họa.

Trong lĩnh vực giáo dục, AI có khả năng tổng hợp dữ liệu từ các bài báo học thuật và video bài giảng để tạo ra tài liệu tóm tắt hoặc thẻ ghi nhớ (flashcard) tương tác, hỗ trợ người học nắm bắt kiến thức mới.

Tính năng Dynamic View trong Gemini tạo ra trải nghiệm tương tác trực quan cho một số truy vấn. Ảnh: Google

Gemini 3 Pro cũng hỗ trợ lập trình viên tốt hơn trong những tác vụ lập trình tác nhân (agentic coding) và “lập trình theo cảm tính” (vibe coding). Ngoài ra, Google còn ra mắt nền tảng phát triển mới tên là Google Antigravity, cho phép các lập trình viên làm việc theo định hướng nhiệm vụ. Trong môi trường này, các tác nhân AI (agent) được cấp quyền truy cập trực tiếp vào trình biên tập mã, cửa sổ lệnh (terminal) và trình duyệt. Chúng có khả năng tự lập kế hoạch, viết mã, thực thi và tự kiểm tra lỗi.

Hiệu quả của phương pháp này được thể hiện qua các chỉ số đo lường cụ thể. Trên bảng xếp hạng WebDev Arena, Gemini 3 dẫn đầu với 1.487 điểm Elo. Khả năng điều khiển máy tính qua dòng lệnh của mô hình đạt 54,2% theo bài kiểm tra Terminal-Bench 2.0. Tuy nhiên, cuộc đua với OpenAI trong lĩnh vực lập trình ứng dụng thực tế vẫn rất sát sao. Tại bảng xếp hạng SWE-bench Verified, Gemini 3 đạt 76,2%, bám đuổi sát nút mức 76,3% của GPT-5.1.

Khả năng suy luận sâu còn giúp Gemini 3 thực hiện vai trò của một trợ lý ảo cao cấp trong việc lập kế hoạch và thực thi chuỗi tác vụ dài hạn. AI có thể tự động sắp xếp hộp thư, đặt các dịch vụ địa phương hoặc tối ưu hóa quy trình làm việc cho doanh nghiệp. Trong các thử nghiệm mô phỏng kéo dài một năm giả lập, mô hình cho thấy sự ổn định và nhất quán trong việc ra quyết định, giúp hoàn thành mục tiêu mà không bị sai lệch hướng đi.

Về vấn đề an toàn và bảo mật dữ liệu, Google khẳng định đây là mô hình an toàn nhất từ trước đến nay của hãng. Hệ thống được trang bị các cơ chế phòng vệ nhằm giảm thiểu rủi ro tấn công mạng, đặc biệt là khả năng chống lại kỹ thuật "prompt injection" (tiêm câu lệnh) vốn thường được tin tặc sử dụng để thao túng AI. Để đảm bảo tính khách quan, Google đã hợp tác với các tổ chức đánh giá độc lập như UK AISI, Apollo, Vaultis và Dreadnode để kiểm định trước khi phát hành.

Hiện tại, người dùng cá nhân và lập trình viên có thể trải nghiệm Gemini 3 Pro thông qua ứng dụng Gemini, công cụ AI Studio, nền tảng Google Antigravity hoặc giao diện dòng lệnh Gemini CLI. Đối với khách hàng doanh nghiệp, mô hình đã sẵn sàng trên nền tảng Vertex AI. Riêng phiên bản chuyên về suy luận Gemini 3 Deep Think vẫn đang trong giai đoạn đánh giá an toàn cuối cùng và chưa được triển khai rộng rãi tới công chúng.

Thái Sơn

URL: https://vietpress.vn/google-ra-mat-gemini-3-ngoi-vuong-ai-doi-chu-d100584.html