Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo

Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Theo dõi Baoquocte.vn trên
Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo. (Nguồn: Shutterstock)
Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại. (Nguồn: Shutterstock)
Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại đó là hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Theo ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này. Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng.

Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Bên cạnh những lợi ích mà trí tuệ nhân tạo (AI) mang lại, cũng có những mối quan tâm về cách giới trẻ tương tác ...

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

Công ty robot Na Uy 1X mới đây đã giới thiệu NEO Gamma có khả năng thực hiện nhiều công việc nhà như giặt giũ, ...

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Theo Giám đốc điều hành Lee Kai-fu của Công ty 01.AI, Trung Quốc đang nhanh chóng bắt kịp Mỹ trong lĩnh vực trí tuệ nhân ...

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Tại hội nghị về công nghệ và năng lượng diễn ra ở thành phố Oklahoma (Mỹ) gần đây, hai “gã khổng lồ” công nghệ Amazon ...

Ứng dụng trí tuệ nhân tạo trong giáo dục

Ứng dụng trí tuệ nhân tạo trong giáo dục

Trí tuệ nhân tạo (AI) đang từng bước thay đổi diện mạo của giáo dục hiện đại, mở ra nhiều khả năng mới cho việc ...

(theo TTXVN)

Đọc thêm

Tử vi 12 cung hoàng đạo Thứ Bảy ngày 6/6/2026: Nhân Mã có quý nhân giúp đỡ

Tử vi 12 cung hoàng đạo Thứ Bảy ngày 6/6/2026: Nhân Mã có quý nhân giúp đỡ

Tử vi hôm nay 6/6/2026 của 12 cung hoàng đạo – Ma Kết, Bảo Bình, Song Ngư, Bạch Dương, Kim Ngưu, Song Tử, Cự Giải, Sư Tử, Xử Nữ, Thiên ...
Lịch thi đấu bóng đá hôm nay 6/6 và sáng 7/6: Lịch thi đấu U19 Đông Nam Á - Campuchia vs Philippines; Hạng nhất Việt Nam

Lịch thi đấu bóng đá hôm nay 6/6 và sáng 7/6: Lịch thi đấu U19 Đông Nam Á - Campuchia vs Philippines; Hạng nhất Việt Nam

Lịch thi đấu bóng đá hôm nay 6/6 và sáng 7/6: Lịch thi đấu U19 Đông Nam Á - Campuchia vs Philippines; giao hữu đội tuyển - Bồ Đào Nha ...
Bài tarot hôm nay 6/6: Nếu như bạn quay lại với người yêu cũ, mối quan hệ sẽ ra sao?

Bài tarot hôm nay 6/6: Nếu như bạn quay lại với người yêu cũ, mối quan hệ sẽ ra sao?

Hãy chọn một lá bài tarot ở bài viết dưới, bạn sẽ nhận được thông điệp nếu quay lại với người yêu cũ, mối quan hệ của hai bạn sẽ ...
Kết quả xổ số hôm nay ngày 5 tháng 6: XSDB, XSTV, XSVL và XSMN 5/6/2026

Kết quả xổ số hôm nay ngày 5 tháng 6: XSDB, XSTV, XSVL và XSMN 5/6/2026

XSMN 5-6, Trực tiếp kết quả xổ số miền Nam 5-6-2025. Kết quả xổ số hôm nay 5-6, được các công ty XSDB, XSTV, XSVL... công bố.
Lịch cúp điện Gia Lai hôm nay ngày 6/6/2026

Lịch cúp điện Gia Lai hôm nay ngày 6/6/2026

Thông tin lịch cúp điện tại Gia Lai theo từng khu vực được cập nhật mới nhất từ Điện lực miền Trung ngày 6/6/2026.
Mitsubishi đồng loạt giảm giá xe trong tháng 6, Xpander được ưu đãi tới 85 triệu đồng

Mitsubishi đồng loạt giảm giá xe trong tháng 6, Xpander được ưu đãi tới 85 triệu đồng

Thị trường ô tô Việt Nam sôi động trong tháng 6/2026 khi Mitsubishi tham gia cuộc đua ưu đãi với chính sách áp dụng trên toàn bộ sản phẩm đang ...
Thượng đỉnh Mỹ-Trung: Hướng tới ổn định chiến lược và thể chế hóa khuôn khổ hợp tác thực chất

Thượng đỉnh Mỹ-Trung: Hướng tới ổn định chiến lược và thể chế hóa khuôn khổ hợp tác thực chất

Cuộc gặp thượng đỉnh giữa hai nhà lãnh đạo Mỹ và Trung Quốc thể hiện nhu cầu lớn của cả hai về ổn định chiến lược và thúc đẩy hợp tác.
Những vấn đề phức tạp của xung đột Trung Đông

Những vấn đề phức tạp của xung đột Trung Đông

Sau hơn hai tháng bom đạn bao phủ vùng Vịnh, cuộc xung đột ở Trung Đông vẫn mờ mịt, nhưng hậu họa thì đã rõ.
Myanmar: Cuộc chuyển giao quyền lực

Myanmar: Cuộc chuyển giao quyền lực

Quá trình chuyển giao quyền lực tại Myanmar từ chính quyền quân sự sang chính phủ dân sự chính danh đã bắt đầu.
Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Việc G7 tổ chức cuộc họp khẩn cấp về nguồn cung dầu mỏ tại Paris là để khẳng định vai trò trung tâm của nhóm trong định hình kinh tế và quản trị toàn cầu.
Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Thủ tướng Nhật Bản Takaichi Sanae đã lên đường sang Washington trong chuyến thăm 4 ngày (từ ngày 18/3).
Tính toán phía sau Lá chắn châu Mỹ

Tính toán phía sau Lá chắn châu Mỹ

Sự ra đời của 'Lá chắn châu Mỹ' có thể coi là bước đi đầu tiên nhằm hiện thực hóa tham vọng của Washington giữ vai trò và vị thế áp đảo tại Tây bán ...
Bầu cử Armenia: Sự lựa chọn giữa Nga và EU?

Bầu cử Armenia: Sự lựa chọn giữa Nga và EU?

Ngày 7/6, cử tri Armenia sẽ đi bỏ phiếu trong cuộc bầu cử Quốc hội, vốn được xem là phép thử quan trọng đối với định hướng địa chính trị của nước này.
Báo Indonesia ca ngợi chuyến thăm của Tổng Bí thư, Chủ tịch nước Tô Lâm

Báo Indonesia ca ngợi chuyến thăm của Tổng Bí thư, Chủ tịch nước Tô Lâm

Trang Kompasiana của Indonesia đăng bài bình luận đánh giá cao chuyến thăm của Tổng Bí thư, Chủ tịch nước Tô Lâm tới 3 nước Thái Lan, Singapore và Philippines.
CNN: Liệu cuộc chiến Iran có 'ép' nhu cầu dầu mỏ của thế giới chạm đỉnh?

CNN: Liệu cuộc chiến Iran có 'ép' nhu cầu dầu mỏ của thế giới chạm đỉnh?

CNN đặt ra một câu hỏi: Liệu cuộc chiến ở Iran có 'ép' nhu cầu dầu mỏ của thế giới chạm đỉnh không?
Quá trình chuyển đổi AI của Nhật Bản sẽ đối mặt với 'thách thức kép' nào?

Quá trình chuyển đổi AI của Nhật Bản sẽ đối mặt với 'thách thức kép' nào?

GS. Akira Kohsaka, Đại học Osaka, đăng bài phân tích về hai thách thức chính đối với quá trình chuyển đổi AI của Nhật Bản.
94 ngày phong tỏa eo biển Hormuz: Khi huyết mạch năng lượng thế giới vẫn chưa thể 'hồi sinh'

94 ngày phong tỏa eo biển Hormuz: Khi huyết mạch năng lượng thế giới vẫn chưa thể 'hồi sinh'

Đây là nhận định của CNN khi tình trạng gián đoạn ở eo biển Hormuz đã bước sang ngày thứ 94.
Khi châu Âu bắt đầu 'học' từ Ukraine

Khi châu Âu bắt đầu 'học' từ Ukraine

Một cấu trúc công nghiệp quốc phòng mới của châu Âu đang dần hình thành và lần này, Ukraine không còn đứng ở bên lề.
Phiên bản di động