Càng thông minh, trí tuệ nhân tạo càng có xu hướng giấu dốt?

Một nhóm nghiên cứu trí tuệ nhân tạo (AI) tại Đại học Bách khoa Valencia, Tây Ban Nha, đã phát hiện rằng khi các mô hình ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời.
Theo dõi Baoquocte.vn trên
Càng thông minh, trí tuệ nhân tạo. càng có xu hướng giấu dốt?. (Ảnh minh hoạ AI)
Càng thông minh, trí tuệ nhân tạo càng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời. (Ảnh minh hoạ AI)

Trong nghiên cứu được công bố trên tạp chí Nature, nhóm đã kiểm tra phiên bản mới nhất của ba chatbot AI phổ biến nhất về phản hồi, độ chính xác và khả năng người dùng phát hiện câu trả lời sai.

Để kiểm tra độ chính xác của ba LLM phổ biến nhất là BLOOM, LLaMA và GPT, nhóm nghiên cứu đã đưa ra hàng nghìn câu hỏi và so sánh câu trả lời nhận được với phản hồi của các phiên bản trước đó cho cùng một câu hỏi. Họ cũng đa dạng hóa chủ đề, bao gồm toán học, khoa học, câu đố chữ và địa lý, cũng như khả năng tạo văn bản hoặc thực hiện các hành động như sắp xếp danh sách.

Kết quả nghiên cứu cho thấy một số xu hướng đáng chú ý. Độ chính xác nói chung của các chatbot được cải thiện qua mỗi phiên bản mới, nhưng vẫn giảm khi đối mặt với những câu hỏi khó hơn. Điều đáng ngạc nhiên là khi LLM trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Trong các phiên bản trước đây, hầu hết LLM sẽ thẳng thắn thông báo với người dùng khi chúng không thể tìm thấy câu trả lời hoặc cần thêm thông tin. Ngược lại, các phiên bản mới hơn có xu hướng đoán nhiều hơn, dẫn đến việc đưa ra nhiều câu trả lời hơn nói chung, bao gồm cả đúng và sai. Đáng lo ngại hơn, nghiên cứu phát hiện rằng tất cả các LLM đôi khi vẫn đưa ra câu trả lời không chính xác ngay cả đối với các câu hỏi dễ, cho thấy độ tin cậy của chúng vẫn còn là một vấn đề cần được cải thiện.

Những phát hiện này nêu bật một nghịch lý trong sự phát triển của AI: mặc dù các mô hình ngày càng mạnh mẽ hơn, chúng cũng có thể trở nên kém minh bạch hơn về những hạn chế của mình.

Điều này đặt ra những thách thức mới trong việc sử dụng và tin tưởng vào các hệ thống AI, đòi hỏi người dùng phải thận trọng hơn và các nhà phát triển cần tập trung vào việc cải thiện không chỉ độ chính xác mà còn cả khả năng "tự nhận thức" của các mô hình.

Triển lãm công nghệ hàng đầu IFA 2024 có gì hot?

Triển lãm công nghệ hàng đầu IFA 2024 có gì hot?

Triển lãm công nghệ về hàng điện tử tiêu dùng 2024 (IFA 2024) được tổ chức tại thủ đô Berlin (Đức) từ ngày 6-10/9, là ...

'Cơn sốt' học AI tại Việt Nam, đến mẹ bỉm sữa cũng quan tâm tìm hiểu

'Cơn sốt' học AI tại Việt Nam, đến mẹ bỉm sữa cũng quan tâm tìm hiểu

Nhu cầu học tập và chia sẻ về AI đang gia tăng khi người muốn nắm bắt và áp dụng công nghệ này vào công ...

Thế giới đã chọn Việt Nam trở thành trung tâm AI, bán dẫn của khu vực

Thế giới đã chọn Việt Nam trở thành trung tâm AI, bán dẫn của khu vực

Nhiều doanh nghiệp hàng đầu thế giới trong các lĩnh vực AI, bán dẫn xem Việt Nam như là một điểm đến mới với nhiều ...

Nhà sáng lập Google quay lại làm việc sau 4 năm vắng bóng

Nhà sáng lập Google quay lại làm việc sau 4 năm vắng bóng

Sergey Brin đã trở về công ty mình đồng sáng lập (Google) để làm việc trong những dự án trí tuệ nhân tạo (AI).

Apple Intelligence sẽ được hỗ trợ tiếng Việt vào năm 2025

Apple Intelligence sẽ được hỗ trợ tiếng Việt vào năm 2025

Trong thông báo mới nhất, Apple cho biết đang lên kế hoạch bổ sung hàng loạt ngôn ngữ trên hệ thống trí tuệ nhân tạo ...

(theo TTXVN)

Đọc thêm

Lịch thi đấu bóng đá hôm nay 16/4 và sáng 17/4: Lịch thi đấu U17 Đông Nam Á - Timor-Leste vs Việt Nam; Europa League - Aston Villa vs Bologna

Lịch thi đấu bóng đá hôm nay 16/4 và sáng 17/4: Lịch thi đấu U17 Đông Nam Á - Timor-Leste vs Việt Nam; Europa League - Aston Villa vs Bologna

Lịch thi đấu bóng đá hôm nay 16/4 và sáng 17/4: Lịch thi đấu U17 Đông Nam Á - Timor-Leste vs Việt Nam; Europa League - Nottingham vs FC Porto...
Ông Nizar Amidi đắc cử Tổng thống Iraq

Ông Nizar Amidi đắc cử Tổng thống Iraq

Ngày 11/4, Quốc hội Iraq khóa V đã bầu ông Nizar Amidi, lãnh đạo cấp cao đảng Liên minh yêu nước Kurdistan (PUK), làm Tổng thống thứ 6 của nước ...
Chủ tịch Quốc hội Trần Thanh Mẫn làm việc với sinh viên, lưu học sinh Việt Nam tại Italy

Chủ tịch Quốc hội Trần Thanh Mẫn làm việc với sinh viên, lưu học sinh Việt Nam tại Italy

Sáng 12/4 (theo giờ địa phương), tại TP. Milan, Chủ tịch Quốc hội Trần Thanh Mẫn đã gặp mặt sinh viên và các lưu học sinh tiêu biểu của Việt ...
Chuyên gia: Tránh biện pháp cực đoan, gây tác dụng ngược khi cấm trẻ em sử dụng mạng xã hội

Chuyên gia: Tránh biện pháp cực đoan, gây tác dụng ngược khi cấm trẻ em sử dụng mạng xã hội

Chuyên gia giáo dục cho rằng cần cân nhắc kỹ lưỡng, tránh áp dụng các biện pháp cực đoan gây tác động ngược đến hoạt động học tập và phát ...
Người phát ngôn Điện Kremlin: Mỹ bận lo việc Trung Đông khiến đàm phán về Ukraine tạm dừng, Nga hiểu điều này

Người phát ngôn Điện Kremlin: Mỹ bận lo việc Trung Đông khiến đàm phán về Ukraine tạm dừng, Nga hiểu điều này

Người phát ngôn Điện Kremlin Dmitry Peskov ngày 12/4 cho biết tiến trình đàm phán về hòa bình Ukraine hiện tạm dừng do phía Mỹ đang bận rộn với các ...
Thủ tướng Slovakia Robert Fico bắt đầu thăm chính thức Việt Nam

Thủ tướng Slovakia Robert Fico bắt đầu thăm chính thức Việt Nam

Chiều 12/4, Thủ tướng Slovakia Robert Fico đến Hà Nội, bắt đầu thăm chính thức Việt Nam từ ngày 12-14/4 theo lời mời của Thủ tướng Chính phủ Lê Minh ...
Myanmar: Cuộc chuyển giao quyền lực

Myanmar: Cuộc chuyển giao quyền lực

Quá trình chuyển giao quyền lực tại Myanmar từ chính quyền quân sự sang chính phủ dân sự chính danh đã bắt đầu.
Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Việc G7 tổ chức cuộc họp khẩn cấp về nguồn cung dầu mỏ tại Paris là để khẳng định vai trò trung tâm của nhóm trong định hình kinh tế và quản trị toàn cầu.
Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Thủ tướng Nhật Bản Takaichi Sanae đã lên đường sang Washington trong chuyến thăm 4 ngày (từ ngày 18/3).
Tính toán phía sau Lá chắn châu Mỹ

Tính toán phía sau Lá chắn châu Mỹ

Sự ra đời của 'Lá chắn châu Mỹ' có thể coi là bước đi đầu tiên nhằm hiện thực hóa tham vọng của Washington giữ vai trò và vị thế áp đảo tại Tây bán ...
Kỳ họp Lưỡng hội Trung Quốc: Tầm nhìn cho phát triển chất lượng cao

Kỳ họp Lưỡng hội Trung Quốc: Tầm nhìn cho phát triển chất lượng cao

Kỳ họp Lưỡng hội Trung Quốc được kỳ vọng vạch tầm nhìn thúc đẩy phát triển chất lượng cao và duy trì đà cải cách của Trung Quốc.
Cơ hội vàng với bà Takaichi Sanae

Cơ hội vàng với bà Takaichi Sanae

Quyết định giải tán Hạ viện được cho là bước đi được tính toán kỹ lưỡng của nữ Thủ tướng Nhật Bản nhằm thiết lập ưu thế vững chắc trên chính trường xứ sở mặt ...
Trí tuệ nhân tạo cảm xúc đã xuất hiện

Trí tuệ nhân tạo cảm xúc đã xuất hiện

Chia sẻ bài viết trên tờ Nikkei Asia, bà Penny Chai - Phó Chủ tịch khu vực châu Á - Thái Bình Dương của Sumsub (*) cho rằng trong một thế giới nơi trí tuệ ...
Nhân dân Nhật báo lý giải ý nghĩa 'hai chuyến thăm đầu tiên của đồng chí Tô Lâm đều tới Trung Quốc'

Nhân dân Nhật báo lý giải ý nghĩa 'hai chuyến thăm đầu tiên của đồng chí Tô Lâm đều tới Trung Quốc'

Nhân dân Nhật báo đăng tải bài viết "Ý nghĩa sâu sắc của việc hai chuyến thăm đầu tiên của đồng chí Tô Lâm đều tới Trung Quốc".
Đại sứ Nguyễn Quốc Dũng: Quan hệ Đối tác chiến lược toàn diện Việt Nam-Hoa Kỳ ngày càng thiết thực và dựa trên lợi ích

Đại sứ Nguyễn Quốc Dũng: Quan hệ Đối tác chiến lược toàn diện Việt Nam-Hoa Kỳ ngày càng thiết thực và dựa trên lợi ích

Đại sứ Việt Nam tại Hoa Kỳ Nguyễn Quốc Dũng trả lời phỏng vấn trang Diplomatic Watch về quan hệ hai nước.
Tình hình Trung Đông: Vì sao tàu thuyền các nước vẫn e ngại khi đi qua eo biển Hormuz?

Tình hình Trung Đông: Vì sao tàu thuyền các nước vẫn e ngại khi đi qua eo biển Hormuz?

Lệnh ngừng bắn mang lại sự tĩnh lặng trên bầu trời Trung Đông, nhưng vẫn chưa đủ để tiếp thêm can đảm cho các hãng vận tải biển đi qua eo biển Hormuz.
Ai bảo vệ các huyết mạch kinh tế toàn cầu?

Ai bảo vệ các huyết mạch kinh tế toàn cầu?

Vấn đề eo biển Hormuz không còn giới hạn ở Trung Đông, mà trở thành phép thử thực sự đối với khả năng phối hợp quốc tế trong bảo vệ các huyết mạch sống còn.
Mục tiêu xuất khẩu hàng may mặc 100 tỷ USD của Ấn Độ gặp hai 'hòn đá tảng' nào?

Mục tiêu xuất khẩu hàng may mặc 100 tỷ USD của Ấn Độ gặp hai 'hòn đá tảng' nào?

Theo CNBC, thuế quan Mỹ và chiến tranh Iran là hai thách thức chính đe dọa mục tiêu xuất khẩu hàng may mặc trị giá 100 tỷ USD của Ấn Độ.
Phiên bản di động