Càng thông minh, các mô hình ngôn ngữ lớn càng thích “giấu dốt”

Thứ hai, ngày 30/09/2024 09:38 GMT+7

VTV.vn - Đáng ngạc nhiên là khi mô hình ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Càng thông minh, các mô hình ngôn ngữ lớn càng thích “giấu dốt”
Ảnh minh hoạ.

Một nhóm nghiên cứu trí tuệ nhân tạo (AI) tại Đại học Bách khoa Valencia, Tây Ban Nha, đã phát hiện rằng, khi các mô hình ngôn ngữ lớn (LLM) trở nên lớn hơn và tinh vi hơn, chúng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời.

Trong nghiên cứu được công bố trên tạp chí Nature, nhóm đã kiểm tra phiên bản mới nhất của ba chatbot AI phổ biến nhất về phản hồi, độ chính xác và khả năng người dùng phát hiện câu trả lời sai.

Để kiểm tra độ chính xác của ba Ngôn ngữ lớn phổ biến nhất là BLOOM, LLaMA và GPT, nhóm nghiên cứu đã đưa ra hàng nghìn câu hỏi và so sánh câu trả lời nhận được với phản hồi của các phiên bản trước đó cho cùng một câu hỏi. Họ cũng đa dạng hóa chủ đề, bao gồm toán học, khoa học, câu đố chữ và địa lý, cũng như khả năng tạo văn bản hoặc thực hiện các hành động như sắp xếp danh sách.

Kết quả nghiên cứu cho thấy, một số xu hướng đáng chú ý. Độ chính xác nói chung của các chatbot được cải thiện qua mỗi phiên bản mới nhưng vẫn giảm khi đối mặt với những câu hỏi khó hơn. Điều đáng ngạc nhiên là khi ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Trong các phiên bản trước đây, hầu hết ngôn ngữ lớn sẽ thẳng thắn thông báo với người dùng khi chúng không thể tìm thấy câu trả lời hoặc cần thêm thông tin. Ngược lại, các phiên bản mới hơn có xu hướng đoán nhiều hơn, dẫn đến việc đưa ra nhiều câu trả lời hơn nói chung, bao gồm cả đúng và sai. Đáng lo ngại hơn, nghiên cứu phát hiện rằng tất cả các ngôn ngữ lớn đôi khi vẫn đưa ra câu trả lời không chính xác ngay cả đối với các câu hỏi dễ, cho thấy độ tin cậy của chúng vẫn còn là một vấn đề cần được cải thiện.

Những phát hiện này nêu bật một nghịch lý trong sự phát triển của AI: mặc dù các mô hình ngày càng mạnh mẽ hơn, chúng cũng có thể trở nên kém minh bạch hơn về những hạn chế của mình. Điều này đặt ra những thách thức mới trong việc sử dụng và tin tưởng vào các hệ thống AI, đòi hỏi người dùng phải thận trọng hơn và các nhà phát triển cần tập trung vào việc cải thiện không chỉ độ chính xác mà còn cả khả năng "tự nhận thức" của các mô hình.

Ra mắt mô hình ngôn ngữ lớn đầu tiên cho ngành bán dẫn Ra mắt mô hình ngôn ngữ lớn đầu tiên cho ngành bán dẫn

VTV.vn - SemiKong - mô hình ngôn ngữ lớn (LLM) mã nguồn mở đầu tiên trên thế giới dành riêng cho ngành công nghiệp bán dẫn vừa chính thức ra mắt.


* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV OnlineVTVGo!

Từ khoá:
Bài liên quan
Hà Nội đồng ý nâng mức hỗ trợ lãi suất vay vốn đầu tư xe buýt điện từ 50% lên 70% để hỗ trợ các doanh nghiệp tham gia phát triển giao thông công cộng theo hướng xanh.
Hà Nội đồng ý nâng mức hỗ trợ lãi suất vay vốn đầu tư xe buýt điện từ 50% lên 70% để hỗ trợ các doanh nghiệp tham gia phát triển giao thông công cộng theo hướng xanh.
Thị trường ô tô Việt Nam đang chứng kiến làn sóng giảm giá chưa từng có, từ xe phổ thông đến xe hạng sang với mức giảm từ vài chục triệu đến gần 3 tỷ đồng.
30/09/2024
Hơn 3 triệu ô tô chưa chuyển đổi tài khoản giao thông trước hạn 1/10/2025, nguy cơ “mắc kẹt” tại trạm thu phí ETC và gây ách tắc nghiêm trọng.
30/09/2024
Sáng 9/9 tại Hà Nội, Viện Nghiên cứu Công nghệ không gian và dưới nước (Đại học Bách khoa Hà Nội) phối hợp cùng Tổng Công ty Khí Việt Nam - CTCP (PV GAS) chính thức phát động Cuộc thi Sáng tạo UAV Cup PV GAS 2025 với chủ đề “Vùng trời quê hương”. Đây là sự kiện góp phần thúc đẩy lĩnh vực kinh tế số và khởi nghiệp trong giới trẻ.
30/09/2024
Thị trường xe máy điện Việt Nam đang bước vào giai đoạn bùng nổ, khi hàng loạt doanh nghiệp trong và ngoài nước tăng tốc gia nhập, mở rộng sản phẩm và đầu tư hạ tầng. Cuộc cạnh tranh không chỉ xoay quanh giá bán hay mẫu mã, mà còn là bài toán công nghệ pin, hệ sinh thái sạc và định vị phân khúc khách hàng.
30/09/2024
Tin mới