Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo

Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Theo dõi Baoquocte.vn trên
Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo. (Nguồn: Shutterstock)
Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại. (Nguồn: Shutterstock)
Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại đó là hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Theo ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này. Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng.

Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Bên cạnh những lợi ích mà trí tuệ nhân tạo (AI) mang lại, cũng có những mối quan tâm về cách giới trẻ tương tác ...

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

Công ty robot Na Uy 1X mới đây đã giới thiệu NEO Gamma có khả năng thực hiện nhiều công việc nhà như giặt giũ, ...

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Theo Giám đốc điều hành Lee Kai-fu của Công ty 01.AI, Trung Quốc đang nhanh chóng bắt kịp Mỹ trong lĩnh vực trí tuệ nhân ...

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Tại hội nghị về công nghệ và năng lượng diễn ra ở thành phố Oklahoma (Mỹ) gần đây, hai “gã khổng lồ” công nghệ Amazon ...

Ứng dụng trí tuệ nhân tạo trong giáo dục

Ứng dụng trí tuệ nhân tạo trong giáo dục

Trí tuệ nhân tạo (AI) đang từng bước thay đổi diện mạo của giáo dục hiện đại, mở ra nhiều khả năng mới cho việc ...

(theo TTXVN)

Đọc thêm

Giá nông sản hôm nay 3/2/2026: Giá cà phê trong nước vững nền giá cao, giá tiêu khó tăng; Thuế quan với nông sản vào Nhật Bản có thể tăng mạnh

Giá nông sản hôm nay 3/2/2026: Giá cà phê trong nước vững nền giá cao, giá tiêu khó tăng; Thuế quan với nông sản vào Nhật Bản có thể tăng mạnh

Báo Thế giới và Việt Nam cập nhật giá nông sản hôm nay 3/2/2026, giá cà phê, giá tiêu, giá gạo xuất khẩu... giao dịch trên thị trường quốc tế ...
Lịch âm hôm nay 2026: Xem lịch âm 4/2/2026, Lịch vạn niên ngày 4 tháng 2 năm 2026

Lịch âm hôm nay 2026: Xem lịch âm 4/2/2026, Lịch vạn niên ngày 4 tháng 2 năm 2026

Lịch âm 4/2. Lịch âm hôm nay 4/2/2026? Âm lịch hôm nay 4/2. Lịch vạn niên 4/2/2026. Ngày hôm nay tốt hay xấu? Xem ngày giờ, hướng tốt xấu...
Tử vi hôm nay, xem tử vi 12 con giáp hôm nay ngày 4/2/2026: Tuổi Mão gặp chuyện không như ý

Tử vi hôm nay, xem tử vi 12 con giáp hôm nay ngày 4/2/2026: Tuổi Mão gặp chuyện không như ý

Xem tử vi 4/2 - tử vi 12 con giáp hôm nay 4/2/2026 - Tý, Sửu, Dần, Mão, Thìn, Tỵ, Ngọ, Mùi, Thân, Dậu, Tuất và Hợi về công việc, ...
Những chuyển biến trong cải cách hành chính tại TP. Hồ Chí Minh

Những chuyển biến trong cải cách hành chính tại TP. Hồ Chí Minh

Những chuyển biến rõ nét trong cải cách hành chính đã và đang 'chuyển hóa' thành động lực tăng trưởng cho TP. Hồ Chí Minh.
Cập nhật bảng giá xe hãng Subaru mới nhất tháng 2/2026

Cập nhật bảng giá xe hãng Subaru mới nhất tháng 2/2026

Bảng giá xe hãng Subaru của các dòng như WRX, Forester, The All New Forest, Outback, BRZ sẽ được cập nhật chi tiết nhất trong bài viết dưới đây.
Venezuela bước sang giai đoạn 'rà soát toàn diện' quan hệ với Mỹ, bổ nhiệm đại diện ngoại giao tại Washington

Venezuela bước sang giai đoạn 'rà soát toàn diện' quan hệ với Mỹ, bổ nhiệm đại diện ngoại giao tại Washington

Ngày 2/2, chính phủ Venezuela đã bổ nhiệm cựu Ngoại trưởng Félix Plasencia làm đại diện ngoại giao của nước này tại Mỹ.
Cơ hội vàng với bà Takaichi Sanae

Cơ hội vàng với bà Takaichi Sanae

Quyết định giải tán Hạ viện được cho là bước đi được tính toán kỹ lưỡng của nữ Thủ tướng Nhật Bản nhằm thiết lập ưu thế vững chắc trên chính trường xứ sở mặt ...
Bước tiến mới trong quan hệ Hàn Quốc-Nhật Bản

Bước tiến mới trong quan hệ Hàn Quốc-Nhật Bản

Chuyến thăm Nhật Bản của Tổng thống Hàn Quốc Lee Jae Myung và gặp gỡ với Thủ tướng nước chủ nhà Sanae Takaichi đã mở ra giai đoạn mới trong quan hệ giữa Seoul và ...
Bước ngoặt trong quan hệ EU-Jordan

Bước ngoặt trong quan hệ EU-Jordan

Là cuộc gặp đầu tiên ở cấp cao nhất, Hội nghị thượng đỉnh Liên minh châu Âu (EU) - Jordan tại Amman vào 8/1 được mô tả là bước ngoặt trong quan hệ giữa hai ...
Iran trước ngã rẽ bất ổn

Iran trước ngã rẽ bất ổn

Làn sóng biểu tình lan rộng đang đẩy Iran vào một thời điểm đặc biệt nhạy cảm để giải bài toán cân bằng sức ép trong -ngoài...
Những thông điệp chiến lược từ Điện Kremlin

Những thông điệp chiến lược từ Điện Kremlin

Thông điệp Tổng thống Vladimir Putin chuyển tải trong cuộc gặp gỡ cuối năm cho thấy cách Moscow đánh giá cục diện toàn cầu và hàm ý chính sách của Moscow.
Tiêu điểm nỗ lực tạo dựng niềm tin

Tiêu điểm nỗ lực tạo dựng niềm tin

Diễn đàn quốc tế về hòa bình và niềm tin, diễn ra tại thủ đô ở Ashgabat của Turkmenistan vào ngày 12/12 kỳ vọng góp phần thúc đẩy hòa bình và phát triển.
Fortune: BRICS kỳ vọng trở thành trụ cột mới của quản trị toàn cầu

Fortune: BRICS kỳ vọng trở thành trụ cột mới của quản trị toàn cầu

Theo Fortune, Nhóm BRICS đang đứng trước cơ hội chiến lược để khẳng định vai trò trụ cột trong hệ thống quản trị toàn cầu.
Chuyến thăm Trung Quốc của Thủ tướng Anh và bài toán cân bằng chiến lược

Chuyến thăm Trung Quốc của Thủ tướng Anh và bài toán cân bằng chiến lược

Theo CNN, Thủ tướng Anh Keir Starmer khẳng định, việc xây dựng mối quan hệ “tinh tế hơn” với Trung Quốc là hết sức cần thiết.
Truyền thông Campuchia ấn tượng với tầm nhìn phát triển dài hạn của Việt Nam

Truyền thông Campuchia ấn tượng với tầm nhìn phát triển dài hạn của Việt Nam

Hãng Thông tấn Quốc gia Campuchia (AKP) và báo Koh Santepheap (Đảo Hòa bình) đăng tải bài bình luận về kết quả Đại hội XIV của Việt Nam.
Nếu Mỹ quyết định tấn công, Iran có thể còn những 'quân bài' nào?

Nếu Mỹ quyết định tấn công, Iran có thể còn những 'quân bài' nào?

Cách thức phản ứng của Iran phụ thuộc chủ yếu vào mức độ đe dọa mà giới lãnh đạo nước này cảm nhận được do Mỹ và đồng minh gây ra.
Đằng sau chiến lược 'ngoại giao AI' của Nhật Bản tại khu vực Trung Á

Đằng sau chiến lược 'ngoại giao AI' của Nhật Bản tại khu vực Trung Á

Trang East Asia Forum đăng tải bài phân tích về chính sách ngoại giao trí tuệ nhân tạo (AI) của Nhật Bản ở khu vực Trung Á.
Hiệp định thương mại tự do EU-Ấn Độ: Phép thử dài hạn của thương mại cởi mở

Hiệp định thương mại tự do EU-Ấn Độ: Phép thử dài hạn của thương mại cởi mở

EU và Ấn Độ vừa ký kết FTA mang tính bước ngoặt, đưa hai bên xích lại gần nhau hơn vào thời điểm thương mại toàn cầu bị định hình bởi căng thẳng địa chính ...
Phiên bản di động