Đối tác Google thừa nhận không có đủ thời gian để đánh giá độ chính xác của chatbot AI

Để đánh giá chất lượng chatbot AI, Google đã thuê bên thứ ba, nhưng các đối tác thừa nhận ‘đoán mò’ khi đánh giá độ chính xác phản hồi chatbot AI.
Theo dõi Baoquocte.vn trên
Đối tác Google thừa nhận không có đủ thời gian để đánh giá độ chính xác của chatbot AI
Độ chính xác các phản hồi của Bard AI đưa ra đang bị đặt dấu hỏi khi các đối tác Google thừa nhận họ phải 'đoán mò' câu trả lời trong một số trường hợp. (Nguồn: Insider)

Người dùng có lẽ sẽ suy nghĩ lại về các câu trả lời của chatbot AI, sau khi họ biết được quy trình đánh giá độ chính xác của các phản hồi này.

Google đã phát hành chatbot Bard dưới dạng giới hạn vào tháng 3 vừa qua, trong nỗ lực đáp trả ChatGPT của OpenAI.

Appen là một nhà thầu đang giúp cải thiện chatbot Google. Các nhân viên của công ty này không được thông báo rằng nhiệm vụ của họ liên quan đến Bard, nhưng các cuộc thảo luận nội bộ về nhiệm vụ mới bắt đầu từ ngày 7/2, khoảng thời gian gã khổng lồ tìm kiếm lần đầu tiên công bố chatbot AI của hãng.

Những đối tác, được gọi là “người đánh giá”, thường xem xét thuật toán tìm kiếm của Google và mức độ liên quan của quảng cáo đặt trong kết quả tìm kiếm, cũng như gắn cờ các website độc hại để chúng không xuất hiện trên trang kết quả.

Nguồn tin của Insider cho hay, kể từ tháng 1, phần lớn công việc những người đánh giá đã chuyển sang xem xét các lời nhắc của AI. Họ nói rằng không có đủ thời gian để chấm điểm độ chính xác các phản hồi mà chatbot đưa ra, do đó đôi khi họ chỉ có thể đưa ra “dự đoán tốt nhất”.

Bard đã nhận chỉ trích sau khi mọi người phát hiện ra chatbot đưa ra câu trả lời sai ngay trong sự kiện ra mắt. Google nói rằng, chatbot sẽ trở nên tốt hơn theo thời gian và không nên coi ứng dụng này là sự thay thế cho công cụ tìm kiếm.

Trước khi ra mắt, vào tháng 2, Google cũng yêu cầu các nhân viên dành từ 2-4 giờ để kiểm tra chatbot, đặt câu hỏi cho nó và gắn cờ những câu trả lời không đáp ứng tiêu chuẩn của công ty.

Các nhà thầu cho biết, họ có một khoảng thời gian nhất định để hoàn thành từng nhiệm vụ, từ ít nhất là 60 giây cho đến hơn vài phút. Tuy nhiên, những người đánh giá nói rằng rất khó để đánh giá phản hồi khi họ không hiểu về chủ đề chatbot đang nói đến, trong đó có các chủ đề kỹ thuật, chẳng hạn như blockchain.

Mỗi nhiệm vụ được giao thể hiện thời gian đều tính phí, do đó các nhân viên sẽ tìm cách hoàn thành nhiệm vụ ngay cả khi họ không thể đánh giá chính xác các phản hồi chatbot đưa ra.

Những nhân viên này nói rằng, họ muốn tìm hiểu đúng sự thật và cung cấp trải nghiệm chatbot chất lượng tốt nhất có thể, nhưng đơn giản là không có đủ thời gian nghiên cứu vấn đề trước khi đưa ra xếp loại.

“Bạn cần 3 giờ nghiên cứu để hoàn thành một nhiệm vụ 60 giây, đó là vấn đề chúng tôi đang gặp phải hiện nay”, một trong những người đánh giá chia sẻ.

Google dẫn đầu thị phần tìm kiếm trực tuyến

Google dẫn đầu thị phần tìm kiếm trực tuyến

Dù trên nền tảng máy tính, hay điện thoại di động, Google - sản phẩm của công ty mẹ Alphabet rất khó bị đánh bại ...

‘Nữ tướng' vừa từ chức CEO YouTube là ai?

‘Nữ tướng' vừa từ chức CEO YouTube là ai?

‘Nữ tướng’ Susan Wojcicki, CEO YouTube là một trong những phụ nữ ảnh hưởng nhất thế giới, đứng thứ 23/100 danh sách phụ nữ quyền ...

ChatGPT đứng trước nhiều thách thức

ChatGPT đứng trước nhiều thách thức

Liệu ChatGPT có thể giữ được đà tăng trưởng thần tốc của mình trước sự nỗ lực của hàng loạt đối thủ mới cùng nhiều ...

Google ra mắt một loạt công cụ AI

Google ra mắt một loạt công cụ AI

Ngày 14/3, Google đã cho ra mắt một loạt các công cụ trí tuệ nhân tạo (AI) cho các dịch vụ như lưu trữ đám ...

Các công ty truyền thông Mỹ đòi quyền lợi từ các 'gã khổng lồ công nghệ'

Các công ty truyền thông Mỹ đòi quyền lợi từ các 'gã khổng lồ công nghệ'

Các tổ chức, công ty truyền thông nhỏ có thể cùng hợp tác để thương lượng về mức giá quảng cáo với các "gã khổng ...

(theo Vietnamnet)

Đọc thêm

Tỷ giá ngoại tệ, tỷ giá USD/VND hôm nay 13/4: Diễn biến của đồng USD phụ thuộc nhiều vào căng thẳng Mỹ-Iran

Tỷ giá ngoại tệ, tỷ giá USD/VND hôm nay 13/4: Diễn biến của đồng USD phụ thuộc nhiều vào căng thẳng Mỹ-Iran

Tỷ giá ngoại tệ, tỷ giá USD/VND hôm nay 13/4 cho thấy diễn biến của đồng USD tiếp tục phụ thuộc nhiều vào căng thẳng Mỹ-Iran.
Học giả Trung Quốc: Chuyến thăm của Tổng Bí thư, Chủ tịch nước Tô Lâm nhằm cụ thể hóa các kế hoạch chiến lược tổng thể

Học giả Trung Quốc: Chuyến thăm của Tổng Bí thư, Chủ tịch nước Tô Lâm nhằm cụ thể hóa các kế hoạch chiến lược tổng thể

Đây là nhận định của GS. Hùng Lý Lực trước thềm chuyến thăm cấp Nhà nước đến Trung Quốc của Tổng Bí thư, Chủ tịch nước Tô Lâm.
Mỹ bắt đầu hành động cứng rắn sau khi đàm phán thất bại với Iran, Tehran phát cảnh báo

Mỹ bắt đầu hành động cứng rắn sau khi đàm phán thất bại với Iran, Tehran phát cảnh báo

Bộ Tư lệnh Trung tâm (CENTCOM) của quân đội Mỹ tuyên bố sẽ bắt đầu phong tỏa toàn bộ hệ thống cảng biển của Iran tại Vịnh Persian từ ngày ...
Lisandro Martinez tái xuất sau hơn hai tháng

Lisandro Martinez tái xuất sau hơn hai tháng

Trong bối cảnh Harry Maguire bị treo giò, Man Utd có sự bổ sung chất lượng khi Lisandro Martinez trở lại sau hơn hai tháng dưỡng thương.
Iran tuyên bố sẵn sàng đạt ‘thỏa thuận cân bằng’, kêu gọi Mỹ tuân thủ luật quốc tế

Iran tuyên bố sẵn sàng đạt ‘thỏa thuận cân bằng’, kêu gọi Mỹ tuân thủ luật quốc tế

Sau đàm phán với Mỹ không đạt kết quả, Tổng thống Iran khẳng định, Tehran vẫn để ngỏ khả năng đạt thỏa thuận nếu Washington đổi cách tiếp cận.
Đình Bắc ghi bàn, CAHN vẫn bị đội cuối bảng chia điểm

Đình Bắc ghi bàn, CAHN vẫn bị đội cuối bảng chia điểm

CAHN để đội cuối bảng PVF-CAND cầm chân với tỷ số 1-1 trên PVF, trong trận đấu vòng 18 V-League diễn ra lúc 18h00 ngày 12/4.
Myanmar: Cuộc chuyển giao quyền lực

Myanmar: Cuộc chuyển giao quyền lực

Quá trình chuyển giao quyền lực tại Myanmar từ chính quyền quân sự sang chính phủ dân sự chính danh đã bắt đầu.
Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Việc G7 tổ chức cuộc họp khẩn cấp về nguồn cung dầu mỏ tại Paris là để khẳng định vai trò trung tâm của nhóm trong định hình kinh tế và quản trị toàn cầu.
Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Thủ tướng Nhật Bản Takaichi Sanae đã lên đường sang Washington trong chuyến thăm 4 ngày (từ ngày 18/3).
Tính toán phía sau Lá chắn châu Mỹ

Tính toán phía sau Lá chắn châu Mỹ

Sự ra đời của 'Lá chắn châu Mỹ' có thể coi là bước đi đầu tiên nhằm hiện thực hóa tham vọng của Washington giữ vai trò và vị thế áp đảo tại Tây bán ...
Kỳ họp Lưỡng hội Trung Quốc: Tầm nhìn cho phát triển chất lượng cao

Kỳ họp Lưỡng hội Trung Quốc: Tầm nhìn cho phát triển chất lượng cao

Kỳ họp Lưỡng hội Trung Quốc được kỳ vọng vạch tầm nhìn thúc đẩy phát triển chất lượng cao và duy trì đà cải cách của Trung Quốc.
Cơ hội vàng với bà Takaichi Sanae

Cơ hội vàng với bà Takaichi Sanae

Quyết định giải tán Hạ viện được cho là bước đi được tính toán kỹ lưỡng của nữ Thủ tướng Nhật Bản nhằm thiết lập ưu thế vững chắc trên chính trường xứ sở mặt ...
Trí tuệ nhân tạo cảm xúc đã xuất hiện

Trí tuệ nhân tạo cảm xúc đã xuất hiện

Chia sẻ bài viết trên tờ Nikkei Asia, bà Penny Chai - Phó Chủ tịch khu vực châu Á - Thái Bình Dương của Sumsub (*) cho rằng trong một thế giới nơi trí tuệ ...
Nhân dân Nhật báo lý giải ý nghĩa 'hai chuyến thăm đầu tiên của đồng chí Tô Lâm đều tới Trung Quốc'

Nhân dân Nhật báo lý giải ý nghĩa 'hai chuyến thăm đầu tiên của đồng chí Tô Lâm đều tới Trung Quốc'

Nhân dân Nhật báo đăng tải bài viết "Ý nghĩa sâu sắc của việc hai chuyến thăm đầu tiên của đồng chí Tô Lâm đều tới Trung Quốc".
Đại sứ Nguyễn Quốc Dũng: Quan hệ Đối tác chiến lược toàn diện Việt Nam-Hoa Kỳ ngày càng thiết thực và dựa trên lợi ích

Đại sứ Nguyễn Quốc Dũng: Quan hệ Đối tác chiến lược toàn diện Việt Nam-Hoa Kỳ ngày càng thiết thực và dựa trên lợi ích

Đại sứ Việt Nam tại Hoa Kỳ Nguyễn Quốc Dũng trả lời phỏng vấn trang Diplomatic Watch về quan hệ hai nước.
Tình hình Trung Đông: Vì sao tàu thuyền các nước vẫn e ngại khi đi qua eo biển Hormuz?

Tình hình Trung Đông: Vì sao tàu thuyền các nước vẫn e ngại khi đi qua eo biển Hormuz?

Lệnh ngừng bắn mang lại sự tĩnh lặng trên bầu trời Trung Đông, nhưng vẫn chưa đủ để tiếp thêm can đảm cho các hãng vận tải biển đi qua eo biển Hormuz.
Ai bảo vệ các huyết mạch kinh tế toàn cầu?

Ai bảo vệ các huyết mạch kinh tế toàn cầu?

Vấn đề eo biển Hormuz không còn giới hạn ở Trung Đông, mà trở thành phép thử thực sự đối với khả năng phối hợp quốc tế trong bảo vệ các huyết mạch sống còn.
Mục tiêu xuất khẩu hàng may mặc 100 tỷ USD của Ấn Độ gặp hai 'hòn đá tảng' nào?

Mục tiêu xuất khẩu hàng may mặc 100 tỷ USD của Ấn Độ gặp hai 'hòn đá tảng' nào?

Theo CNBC, thuế quan Mỹ và chiến tranh Iran là hai thách thức chính đe dọa mục tiêu xuất khẩu hàng may mặc trị giá 100 tỷ USD của Ấn Độ.
Phiên bản di động