Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo

Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Theo dõi Baoquocte.vn trên
Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo. (Nguồn: Shutterstock)
Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại. (Nguồn: Shutterstock)
Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại đó là hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Theo ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này. Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng.

Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Bên cạnh những lợi ích mà trí tuệ nhân tạo (AI) mang lại, cũng có những mối quan tâm về cách giới trẻ tương tác ...

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

Công ty robot Na Uy 1X mới đây đã giới thiệu NEO Gamma có khả năng thực hiện nhiều công việc nhà như giặt giũ, ...

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Theo Giám đốc điều hành Lee Kai-fu của Công ty 01.AI, Trung Quốc đang nhanh chóng bắt kịp Mỹ trong lĩnh vực trí tuệ nhân ...

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Tại hội nghị về công nghệ và năng lượng diễn ra ở thành phố Oklahoma (Mỹ) gần đây, hai “gã khổng lồ” công nghệ Amazon ...

Ứng dụng trí tuệ nhân tạo trong giáo dục

Ứng dụng trí tuệ nhân tạo trong giáo dục

Trí tuệ nhân tạo (AI) đang từng bước thay đổi diện mạo của giáo dục hiện đại, mở ra nhiều khả năng mới cho việc ...

(theo TTXVN)

Đọc thêm

Đàm phán Mỹ-Iran: Tổng thống Trump chấp nhận việc Tehran ngừng làm giàu urani trong 20 năm, để ngỏ khả năng dỡ bỏ biện pháp trừng phạt dầu

Đàm phán Mỹ-Iran: Tổng thống Trump chấp nhận việc Tehran ngừng làm giàu urani trong 20 năm, để ngỏ khả năng dỡ bỏ biện pháp trừng phạt dầu

Đàm phán Mỹ-Iran có tín hiệu khả quan: Tổng thống Trump chấp nhận việc Tehran ngừng làm giàu urani trong 20 năm, để ngỏ khả năng dỡ bỏ biện pháp ...
Lịch âm hôm nay 2026: Xem lịch âm 16/5/2026, Lịch vạn niên ngày 16 tháng 5 năm 2026

Lịch âm hôm nay 2026: Xem lịch âm 16/5/2026, Lịch vạn niên ngày 16 tháng 5 năm 2026

Lịch âm 16/5. Lịch âm hôm nay 16/5/2026? Âm lịch hôm nay 16/5. Lịch vạn niên 16/5/2026. Ngày hôm nay tốt hay xấu? Xem ngày giờ, hướng tốt xấu...
Đặc phái viên của Tổng Bí thư, Chủ tịch nước Tô Lâm hội kiến lãnh đạo Triều Tiên

Đặc phái viên của Tổng Bí thư, Chủ tịch nước Tô Lâm hội kiến lãnh đạo Triều Tiên

Đặc phái viên của Tổng Bí thư, Chủ tịch nước Tô Lâm - đồng chí Lê Hoài Trung hội kiến với lãnh đạo cấp cao Hội nghị nhân dân tối ...
Hàng Việt Nam quảng bá tại Triển lãm quốc tế Kazakhstan 2026

Hàng Việt Nam quảng bá tại Triển lãm quốc tế Kazakhstan 2026

Triển lãm quốc tế Kazakhstan lần thứ 26 về 'Sản phẩm thực phẩm, đồ uống, nguyên liệu, bao bì và thiết bị cho ngành công nghiệp thực phẩm'.
Đẩy mạnh triển khai quan hệ Đối tác chiến lược toàn diện ASEAN - New Zealand vì lợi ích chung

Đẩy mạnh triển khai quan hệ Đối tác chiến lược toàn diện ASEAN - New Zealand vì lợi ích chung

Thứ trưởng Ngoại giao Đặng Hoàng Giang tham dự Đối thoại ASEAN-New Zealand lần thứ 33 tại New Zealand từ ngày 14 - 15/5.
Giá vàng hôm nay 16/5/2026 giảm sốc theo đà bán tháo khỏi mức đỉnh lịch sử, Trung Quốc đang 'đổi chủ' tại các mỏ vàng ở Tây Phi

Giá vàng hôm nay 16/5/2026 giảm sốc theo đà bán tháo khỏi mức đỉnh lịch sử, Trung Quốc đang 'đổi chủ' tại các mỏ vàng ở Tây Phi

Giá vàng hôm nay 16/5/2026 giảm sốc theo đà bán tháo khỏi mức đỉnh lịch sử, Trung Quốc đang 'đổi chủ' tại các mỏ vàng ở Tây Phi.
Thượng đỉnh Mỹ-Trung: Hướng tới ổn định chiến lược và thể chế hóa khuôn khổ hợp tác thực chất

Thượng đỉnh Mỹ-Trung: Hướng tới ổn định chiến lược và thể chế hóa khuôn khổ hợp tác thực chất

Cuộc gặp thượng đỉnh giữa hai nhà lãnh đạo Mỹ và Trung Quốc thể hiện nhu cầu lớn của cả hai về ổn định chiến lược và thúc đẩy hợp tác.
Những vấn đề phức tạp của xung đột Trung Đông

Những vấn đề phức tạp của xung đột Trung Đông

Sau hơn hai tháng bom đạn bao phủ vùng Vịnh, cuộc xung đột ở Trung Đông vẫn mờ mịt, nhưng hậu họa thì đã rõ.
Myanmar: Cuộc chuyển giao quyền lực

Myanmar: Cuộc chuyển giao quyền lực

Quá trình chuyển giao quyền lực tại Myanmar từ chính quyền quân sự sang chính phủ dân sự chính danh đã bắt đầu.
Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Việc G7 tổ chức cuộc họp khẩn cấp về nguồn cung dầu mỏ tại Paris là để khẳng định vai trò trung tâm của nhóm trong định hình kinh tế và quản trị toàn cầu.
Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Thủ tướng Nhật Bản Takaichi Sanae đã lên đường sang Washington trong chuyến thăm 4 ngày (từ ngày 18/3).
Tính toán phía sau Lá chắn châu Mỹ

Tính toán phía sau Lá chắn châu Mỹ

Sự ra đời của 'Lá chắn châu Mỹ' có thể coi là bước đi đầu tiên nhằm hiện thực hóa tham vọng của Washington giữ vai trò và vị thế áp đảo tại Tây bán ...
Ngoại giao công chúng của Singapore: Khi đam mê khai mở tiềm năng

Ngoại giao công chúng của Singapore: Khi đam mê khai mở tiềm năng

Chiến dịch 'Passion Made Possible' do Singapore khởi xướng năm 2017 nên được xem là một hoạt động ngoại giao công chúng có chủ đích.
Tổng thống Trump thăm Bắc Kinh: 'So găng' vị thế siêu cường kinh tế của Mỹ và Trung Quốc

Tổng thống Trump thăm Bắc Kinh: 'So găng' vị thế siêu cường kinh tế của Mỹ và Trung Quốc

Chuyến thăm Trung Quốc của Tổng thống Trump diễn ra khi cạnh tranh được định hình rõ nét trên lĩnh vực kinh tế, năng lực công nghệ và ảnh hưởng toàn cầu.
Không phải Nga, đây mới là quốc gia mà châu Âu nhập khẩu ngày càng nhiều khí đốt

Không phải Nga, đây mới là quốc gia mà châu Âu nhập khẩu ngày càng nhiều khí đốt

Châu Âu dự kiến sẽ đáp ứng gần hai phần ba nhu cầu khí tự nhiên hóa lỏng (LNG) nhập khẩu từ Mỹ vào năm 2026.
Brazil 'ngỡ ngàng' trước quyết định EU đóng cửa với thịt nhập khẩu

Brazil 'ngỡ ngàng' trước quyết định EU đóng cửa với thịt nhập khẩu

Đại sứ Brazil tại Liên minh châu Âu (EU) Pedro Miguel da Costa e Silva cho biết Brazil 'bất ngờ' trước quyết định của EU cấm nhập khẩu thịt từ nước này.
Căng thẳng Mỹ-Iran có thể bất ngờ tác động tích cực đến nền kinh tế toàn cầu?

Căng thẳng Mỹ-Iran có thể bất ngờ tác động tích cực đến nền kinh tế toàn cầu?

Trong khi cuộc chiến tại Iran có thể gây ra những hệ lụy kinh tế nghiêm trọng, thì về dài hạn, kinh tế toàn cầu lại có khả năng càng được hưởng lợi.
Vai trò ngày càng quan trọng của hòa giải quốc tế và cơ hội cho Thái Lan

Vai trò ngày càng quan trọng của hòa giải quốc tế và cơ hội cho Thái Lan

Ở nhiều nơi trên thế giới, đối thoại ngày càng trở nên khó khăn, song chính trong hoàn cảnh như vậy, hòa giải lại càng trở nên cần thiết hơn hết.
Phiên bản di động