Google âm thầm thống lĩnh 'đường đua AI'
Giữa cuộc cạnh tranh khốc liệt nhất lịch sử công nghệ, Google (Alphabet) đang khéo léo lật ngược thế cờ, vượt qua các đối thủ đình đám như OpenAI và Microsoft.
hoặc
Vui lòng nhập thông tin cá nhân
hoặc
Vui lòng nhập thông tin cá nhân
Nhập email của bạn để lấy lại mật khẩu
Một nhóm nhà khoa học Mỹ vừa công bố công nghệ đột phá có khả năng biến tín hiệu não bộ thành những câu mô tả chính xác về hình ảnh hoặc khung cảnh mà con người đang nghĩ tới.
Công nghệ mới mang tên “mind-captioning”, tạm dịch là “chú thích suy nghĩ”, được đánh giá là bước tiến đáng chú ý trong lĩnh vực trí tuệ nhân tạo và khoa học thần kinh.
Hệ thống này có thể giải mã hoạt động não và chuyển đổi những gì con người nhìn thấy hoặc tưởng tượng trong đầu thành câu chữ với độ chính xác cao. Công trình được đăng trên tạp chí Science Advances, mở ra viễn cảnh mới trong việc hiểu cách não bộ diễn giải thế giới xung quanh. Đồng thời, công nghệ cũng có tiềm năng hỗ trợ những người mắc chứng rối loạn ngôn ngữ, chẳng hạn sau đột quỵ, trong việc giao tiếp.
Theo nhóm nghiên cứu tại Đại học California (Mỹ), kỹ thuật này dựa trên công nghệ chụp hình não không xâm lấn để ghi nhận hoạt động thần kinh. Dữ liệu sau đó được đưa vào các mô hình ngôn ngữ AI tiên tiến, giúp dự đoán và mô tả chính xác điều mà người tham gia đang nhìn hoặc tưởng tượng.
“Hệ thống có thể dự đoán ở mức độ chi tiết những gì một người đang nhìn thấy. Đây là điều chưa từng có tiền lệ”, nhà khoa học thần kinh tính toán Alex Huth khẳng định.

Trong hơn một thập kỷ qua, các nhà nghiên cứu đã cố gắng dự đoán hình ảnh hoặc âm thanh từ tín hiệu não, nhưng việc “dịch” những nội dung phức tạp như video hay hình dạng trừu tượng thành ngôn ngữ vẫn là thách thức lớn. Các phương pháp trước đây chỉ nhận diện từ khóa đơn lẻ, chưa thể hiểu toàn bộ ngữ cảnh như chủ thể, hành động hay môi trường xung quanh.
Để khắc phục hạn chế này, nhóm nghiên cứu của ông Tomoyasu Horikawa, nhà khoa học thần kinh tại Phòng thí nghiệm Khoa học Truyền thông NTT ở Nhật Bản, phát triển mô hình AI ngôn ngữ sâu. Họ phân tích phụ đề của hơn 2.000 video, chuyển mỗi đoạn thành “chữ ký ý nghĩa”, dạng biểu đồ số thể hiện nội dung video.
Sau đó, một hệ thống AI khác được huấn luyện để nhận diện mối quan hệ giữa các chữ ký ý nghĩa này và hoạt động não của 6 người tham gia khi xem video. Kết quả cho thấy AI có thể “dịch” chính xác những gì người tham gia đang xem hoặc tưởng tượng thành câu mô tả hoàn chỉnh, không chỉ đơn thuần liệt kê từ khóa.
Các chuyên gia nhận định, công nghệ mind-captioning không chỉ là cột mốc trong nghiên cứu khoa học thần kinh mà còn mở ra cơ hội ứng dụng thực tiễn rộng lớn. Trong tương lai, kỹ thuật này có thể giúp những người mất khả năng nói giao tiếp thông qua tín hiệu não.
Dù vẫn đang ở giai đoạn đầu, mind-captioning đánh dấu bước tiến quan trọng trong hành trình giải mã ngôn ngữ của tư duy con người, đưa viễn cảnh “đọc suy nghĩ” vốn chỉ xuất hiện trong phim khoa học viễn tưởng tiến gần hơn với thực tế.