Kết quả đánh giá cho thấy GPT o3 và o4-mini đang tự bịa đặt các thông tin không có thật còn nhiều hơn cả các phiên bản trước đó. Vấn đề này được chính OpenAI thừa nhận, nhưng công ty cho biết chưa tìm ra nguyên nhân và phương án xử lý.
Chỉ hai ngày sau khi công bố GPT-4.1, OpenAI tiếp tục gây
chú ý khi ra mắt cùng lúc hai mô hình ngôn ngữ mới: o3 và o4-mini. Cả hai được
quảng bá với khả năng suy luận vượt trội và nhiều cải tiến đáng kể. Tuy nhiên,
theo TechCrunch, bộ đôi mô hình mới này vẫn gặp phải tình trạng "ảo
giác" (hallucinate) hay tự bịa đặt thông tin. Thậm chí, chúng còn gặp
"ảo giác" nhiều hơn một số mô hình cũ của OpenAI.
Chỉ hai ngày sau khi công bố GPT-4.1, OpenAI tiếp tục gây
chú ý khi ra mắt cùng lúc hai mô hình ngôn ngữ mới: o3 và o4-mini. Cả hai được
quảng bá với khả năng suy luận vượt trội và nhiều cải tiến đáng kể. Tuy nhiên,
theo TechCrunch, bộ đôi mô hình mới này vẫn gặp phải tình trạng "ảo
giác" (hallucinate) hay tự bịa đặt thông tin. Thậm chí, chúng còn gặp
"ảo giác" nhiều hơn một số mô hình cũ của OpenAI.
Hai mô hình ChatGPT vừa ra mắt có tần suất bịa đặt thông tin nhiều hơn thế hệ cũ. Ảnh: Wired
Theo IBM, "ảo giác" xảy ra khi các mô hình ngôn ngữ
lớn (LLM), như chatbot hoặc công cụ thị giác máy tính, xử lý dữ liệu không tồn
tại hoặc không thể nhận dạng, dẫn đến kết quả vô nghĩa hoặc sai sự thật.
Báo cáo mới nhất từ OpenAI cho thấy mô hình o3 gặp "ảo
giác" trong 33% câu hỏi trên PersonQA – tiêu chuẩn nội bộ để đánh giá độ
chính xác kiến thức về con người. Con số này gấp đôi tỷ lệ "ảo giác"
của các mô hình trước đó như o1 (16%) và o3-mini (14,8%). Đáng chú ý, o4-mini
còn tệ hơn khi mắc lỗi "ảo giác" tới 48% trong cùng bài kiểm tra.
Điều đáng lo ngại là OpenAI thừa nhận chưa tìm ra nguyên
nhân chính xác. Trong báo cáo kỹ thuật, công ty cho biết: "Cần nghiên cứu
thêm để hiểu tại sao tình trạng 'ảo giác' trở nên nghiêm trọng hơn khi mở rộng
quy mô các mô hình suy luận."
O3 và o4-mini hoạt động tốt hơn ở một số lĩnh vực, bao gồm
các tác vụ liên quan đến lập trình và toán học. Tuy nhiên, do cần "đưa ra
nhiều tuyên bố hơn là nói tổng quát", cả hai mô hình này đã gặp tình trạng
cho ra kết quả gồm "nhiều tuyên bố chính xác hơn, nhưng đồng thời cũng xuất
hiện nhiều tuyên bố không chính xác hơn".
Người dùng phát hiện ra rằng các mô hình mới nhất của ChatGPT có khả năng suy ra vị trí chụp ảnh chỉ từ chính hình ảnh đó. Điều này làm dấy lên những lo ngại về bảo mật thông tin và quyền riêng tư.
Thông tin tại Diễn đàn Đổi mới và Sở hữu trí tuệ lần thứ 6 vừa được tổ chức, Huawei cho biết, công ty đã tạo ra khoảng 630 triệu USD doanh thu từ hoạt động cấp phép bằng sáng chế trong năm 2024.
Bất chấp nỗ lực kiểm soát, kho ứng dụng Google Play vẫn liên tục xuất hiện các phần mềm độc hại, gây rủi ro cho hàng triệu người dùng điện thoại có hệ điều hành Android.
Nokia đang tiếp tục mở rộng chiến dịch kiện tụng bằng sáng chế tại Mỹ với đơn tố cáo mới nhất cáo buộc Warner Bros. Discovery xâm phạm công nghệ mã hóa và phát video trực tuyến.
Tổng thống Mỹ Donald Trump tuyên bố sẽ không cho phép bất kỳ quốc gia nào ngoài Mỹ tiếp cận dòng chip AI Blackwell tiên tiến nhất của Nvidia, động thái thể hiện xu hướng bảo hộ công nghệ bán dẫn hàng đầu thế giới.
Tại Triển lãm Ô tô Nhật Bản 2025, gian hàng của Toyota thu hút đông đảo khách tham quan với loạt ý tưởng độc đáo, trong đó nổi bật là mẫu xe điện tự lái Kids Mobi dành riêng cho trẻ nhỏ.
Chiếc Geely Xingyuan bất ngờ bốc cháy dữ dội, phát nổ như đạn pháo giữa đường phố Tô Châu, làm dấy lên lo ngại về độ an toàn của xe điện giá rẻ tại Trung Quốc.
Nhà sản xuất chip Nexperia đang trở thành tâm điểm khủng hoảng mới của ngành ô tô toàn cầu, khi căng thẳng địa chính trị khiến chuỗi cung ứng bán dẫn đứng trước nguy cơ đứt gãy.