Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo

Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Theo dõi Baoquocte.vn trên
Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo. (Nguồn: Shutterstock)
Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại. (Nguồn: Shutterstock)
Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại đó là hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Theo ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này. Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng.

Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Bên cạnh những lợi ích mà trí tuệ nhân tạo (AI) mang lại, cũng có những mối quan tâm về cách giới trẻ tương tác ...

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

Công ty robot Na Uy 1X mới đây đã giới thiệu NEO Gamma có khả năng thực hiện nhiều công việc nhà như giặt giũ, ...

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Theo Giám đốc điều hành Lee Kai-fu của Công ty 01.AI, Trung Quốc đang nhanh chóng bắt kịp Mỹ trong lĩnh vực trí tuệ nhân ...

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Tại hội nghị về công nghệ và năng lượng diễn ra ở thành phố Oklahoma (Mỹ) gần đây, hai “gã khổng lồ” công nghệ Amazon ...

Ứng dụng trí tuệ nhân tạo trong giáo dục

Ứng dụng trí tuệ nhân tạo trong giáo dục

Trí tuệ nhân tạo (AI) đang từng bước thay đổi diện mạo của giáo dục hiện đại, mở ra nhiều khả năng mới cho việc ...

(theo TTXVN)

Đọc thêm

Thái Lan tăng tốc ký kết 3 FTA lớn trong năm 2026

Thái Lan tăng tốc ký kết 3 FTA lớn trong năm 2026

Thái Lan đang đẩy nhanh tiến trình hoàn tất 3 hiệp định thương mại tự do (FTA) lớn trong năm 2026 nhằm mở rộng tiếp cận thị trường.
Thành phố Đà Nẵng cần tập trung biến dư địa mới thành năng lực tăng trưởng

Thành phố Đà Nẵng cần tập trung biến dư địa mới thành năng lực tăng trưởng

Chiều 25/4, tại Đà Nẵng, Tổng Bí thư, Chủ tịch nước Tô Lâm và Đoàn công tác của Trung ương làm việc với Ban Thường vụ Thành ủy Đà Nẵng.
Ca sĩ Justin Bieber khoe khoảnh khắc đi câu cá ngọt ngào bên con trai nhỏ

Ca sĩ Justin Bieber khoe khoảnh khắc đi câu cá ngọt ngào bên con trai nhỏ

Sau hai tuần bận rộn trình diễn ở lễ hội âm nhạc Coachella, Justin Bieber dành thời gian đi chơi với con trai gần hai tuổi.
Giáo sư Furuta Motoo: Hiểu Việt Nam để hiểu thế giới

Giáo sư Furuta Motoo: Hiểu Việt Nam để hiểu thế giới

Lựa chọn nghiên cứu Việt Nam như một chìa khóa để lý giải thế giới, hơn 50 năm qua, Giáo sư Furuta Motoo làm cầu nối bền bỉ trong hợp ...
Thông tin về 9 luật và 31 nghị quyết được Quốc hội thông qua tại Kỳ họp thứ nhất, Quốc hội khóa XVI

Thông tin về 9 luật và 31 nghị quyết được Quốc hội thông qua tại Kỳ họp thứ nhất, Quốc hội khóa XVI

Quốc hội xem xét, thông qua 9 luật, 5 nghị quyết quy phạm pháp luật; quyết định các vấn đề về kinh tế - xã hội, tài chính, ngân sách…
Khung giờ cao điểm, thấp điểm và giờ bình thường của hệ thống điện quốc gia

Khung giờ cao điểm, thấp điểm và giờ bình thường của hệ thống điện quốc gia

Bộ Công Thương ban hành Quyết định số 963/QĐ-BCT ngày 22/4/2026 quy định khung giờ cao điểm, thấp điểm và giờ bình thường của hệ thống điện quốc gia.
Myanmar: Cuộc chuyển giao quyền lực

Myanmar: Cuộc chuyển giao quyền lực

Quá trình chuyển giao quyền lực tại Myanmar từ chính quyền quân sự sang chính phủ dân sự chính danh đã bắt đầu.
Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Việc G7 tổ chức cuộc họp khẩn cấp về nguồn cung dầu mỏ tại Paris là để khẳng định vai trò trung tâm của nhóm trong định hình kinh tế và quản trị toàn cầu.
Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Thủ tướng Nhật Bản Takaichi Sanae đã lên đường sang Washington trong chuyến thăm 4 ngày (từ ngày 18/3).
Tính toán phía sau Lá chắn châu Mỹ

Tính toán phía sau Lá chắn châu Mỹ

Sự ra đời của 'Lá chắn châu Mỹ' có thể coi là bước đi đầu tiên nhằm hiện thực hóa tham vọng của Washington giữ vai trò và vị thế áp đảo tại Tây bán ...
Kỳ họp Lưỡng hội Trung Quốc: Tầm nhìn cho phát triển chất lượng cao

Kỳ họp Lưỡng hội Trung Quốc: Tầm nhìn cho phát triển chất lượng cao

Kỳ họp Lưỡng hội Trung Quốc được kỳ vọng vạch tầm nhìn thúc đẩy phát triển chất lượng cao và duy trì đà cải cách của Trung Quốc.
Cơ hội vàng với bà Takaichi Sanae

Cơ hội vàng với bà Takaichi Sanae

Quyết định giải tán Hạ viện được cho là bước đi được tính toán kỹ lưỡng của nữ Thủ tướng Nhật Bản nhằm thiết lập ưu thế vững chắc trên chính trường xứ sở mặt ...
Trung Quốc thúc đẩy hòa giải Thái Lan-Campuchia qua đối thoại *

Trung Quốc thúc đẩy hòa giải Thái Lan-Campuchia qua đối thoại *

Sau khi căng thẳng xung đột biên giới Campuchia - Thái Lan leo thang vào giữa năm 2025, Trung Quốc đã liên tục tiến hành các nỗ lực trung gian nhằm thúc đẩy hòa bình ...
Kinh tế Mỹ 'dễ tổn thương hơn tưởng tượng' khi cú sốc nguồn cung ở châu Á đang lan rộng

Kinh tế Mỹ 'dễ tổn thương hơn tưởng tượng' khi cú sốc nguồn cung ở châu Á đang lan rộng

Theo CNN, cú sốc nguồn cung đang leo thang ở châu Á hiện sắp lan tới nước Mỹ, cho thấy nền kinh tế hàng đầu thế giới 'dễ tổn thương hơn tưởng tượng'.
The Economist: Guyana – Quốc gia nhỏ được hưởng lợi lớn từ xung đột Trung Đông

The Economist: Guyana – Quốc gia nhỏ được hưởng lợi lớn từ xung đột Trung Đông

Theo The Economist, Guyana đã trở thành quốc gia được hưởng lợi từ việc giá dầu tăng cao do xung đột tại Trung Đông.
Châu Âu chi 28 tỷ USD để mua một mặt hàng chịu ảnh hưởng nặng nề bởi căng thẳng Trung Đông

Châu Âu chi 28 tỷ USD để mua một mặt hàng chịu ảnh hưởng nặng nề bởi căng thẳng Trung Đông

EU vừa công bố hàng loạt biện pháp khẩn cấp nhằm giảm thiểu tác động cho nền kinh tế trước tình trạng chi phí năng lượng tăng vọt.
Kinh tế Mỹ: Tổng thống Trump trấn an người dân về việc giá xăng tăng cao

Kinh tế Mỹ: Tổng thống Trump trấn an người dân về việc giá xăng tăng cao

Trong bối cảnh giá xăng dầu tăng cao, người dân Mỹ quan tâm đến giá cả hơn, thay vì các học thuyết kinh tế của chính quyền Tổng thống Trump.
Foreign Affairs: Căng thẳng Mỹ-Iran đang tạo thêm lợi thế cho Trung Quốc

Foreign Affairs: Căng thẳng Mỹ-Iran đang tạo thêm lợi thế cho Trung Quốc

Theo Foreign Affairs, căng thẳng Mỹ-Iran không đem lại lợi ích chiến lược rõ ràng cho Mỹ trong cạnh tranh với Trung Quốc.
Phiên bản di động