Càng thông minh, các mô hình ngôn ngữ lớn càng thích “giấu dốt”

Thứ hai, ngày 30/09/2024 09:38 GMT+7

VTV.vn - Đáng ngạc nhiên là khi mô hình ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Càng thông minh, các mô hình ngôn ngữ lớn càng thích “giấu dốt”
Ảnh minh hoạ.

Một nhóm nghiên cứu trí tuệ nhân tạo (AI) tại Đại học Bách khoa Valencia, Tây Ban Nha, đã phát hiện rằng, khi các mô hình ngôn ngữ lớn (LLM) trở nên lớn hơn và tinh vi hơn, chúng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời.

Trong nghiên cứu được công bố trên tạp chí Nature, nhóm đã kiểm tra phiên bản mới nhất của ba chatbot AI phổ biến nhất về phản hồi, độ chính xác và khả năng người dùng phát hiện câu trả lời sai.

Để kiểm tra độ chính xác của ba Ngôn ngữ lớn phổ biến nhất là BLOOM, LLaMA và GPT, nhóm nghiên cứu đã đưa ra hàng nghìn câu hỏi và so sánh câu trả lời nhận được với phản hồi của các phiên bản trước đó cho cùng một câu hỏi. Họ cũng đa dạng hóa chủ đề, bao gồm toán học, khoa học, câu đố chữ và địa lý, cũng như khả năng tạo văn bản hoặc thực hiện các hành động như sắp xếp danh sách.

Kết quả nghiên cứu cho thấy, một số xu hướng đáng chú ý. Độ chính xác nói chung của các chatbot được cải thiện qua mỗi phiên bản mới nhưng vẫn giảm khi đối mặt với những câu hỏi khó hơn. Điều đáng ngạc nhiên là khi ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Trong các phiên bản trước đây, hầu hết ngôn ngữ lớn sẽ thẳng thắn thông báo với người dùng khi chúng không thể tìm thấy câu trả lời hoặc cần thêm thông tin. Ngược lại, các phiên bản mới hơn có xu hướng đoán nhiều hơn, dẫn đến việc đưa ra nhiều câu trả lời hơn nói chung, bao gồm cả đúng và sai. Đáng lo ngại hơn, nghiên cứu phát hiện rằng tất cả các ngôn ngữ lớn đôi khi vẫn đưa ra câu trả lời không chính xác ngay cả đối với các câu hỏi dễ, cho thấy độ tin cậy của chúng vẫn còn là một vấn đề cần được cải thiện.

Những phát hiện này nêu bật một nghịch lý trong sự phát triển của AI: mặc dù các mô hình ngày càng mạnh mẽ hơn, chúng cũng có thể trở nên kém minh bạch hơn về những hạn chế của mình. Điều này đặt ra những thách thức mới trong việc sử dụng và tin tưởng vào các hệ thống AI, đòi hỏi người dùng phải thận trọng hơn và các nhà phát triển cần tập trung vào việc cải thiện không chỉ độ chính xác mà còn cả khả năng "tự nhận thức" của các mô hình.

Ra mắt mô hình ngôn ngữ lớn đầu tiên cho ngành bán dẫn Ra mắt mô hình ngôn ngữ lớn đầu tiên cho ngành bán dẫn

VTV.vn - SemiKong - mô hình ngôn ngữ lớn (LLM) mã nguồn mở đầu tiên trên thế giới dành riêng cho ngành công nghiệp bán dẫn vừa chính thức ra mắt.


* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV OnlineVTVGo!

Từ khoá:
Bài liên quan
Bộ Thương mại Mỹ vừa chính thức mở cuộc điều tra về tác động của việc nhập khẩu chip bán dẫn và dược phẩm đối với an ninh quốc gia. Đây có thể là bước đệm cho các biện pháp áp thuế mạnh tay, đẩy căng thẳng thương mại Mỹ – thế giới lên một nấc thang mới dưới thời Tổng thống Donald Trump.
Bộ Thương mại Mỹ vừa chính thức mở cuộc điều tra về tác động của việc nhập khẩu chip bán dẫn và dược phẩm đối với an ninh quốc gia. Đây có thể là bước đệm cho các biện pháp áp thuế mạnh tay, đẩy căng thẳng thương mại Mỹ – thế giới lên một nấc thang mới dưới thời Tổng thống Donald Trump.
Hàn Quốc công bố gói hỗ trợ 23 tỷ USD cho ngành bán dẫn nhằm đối phó rủi ro thuế quan từ Mỹ và cạnh tranh ngày càng tăng từ các đối thủ Trung Quốc.
30/09/2024
Người sáng lập công ty công nghệ tài chính bị buộc tội gian lận khi ứng dụng mua sắm 'AI' của người này lại do con người điều khiển tại Philippines.
30/09/2024
Dự kiến đưa vào hoạt động từ 6.5, Nền tảng đào tạo và cấp chứng nhận an ninh mạng NCA Academy (nCademy) được kỳ vọng sẽ trở thành công vụ quan trọng giúp Việt Nam nâng cao năng lực quốc gia về an toàn, an ninh mạng.
30/09/2024
Trung Quốc đặt mục tiêu trở thành trung tâm đổi mới trí tuệ nhân tạo hàng đầu thế giới vào năm 2030.
30/09/2024
Tin mới