Càng thông minh, các mô hình ngôn ngữ lớn càng thích “giấu dốt”

30/09/2024

VTV.vn - Đáng ngạc nhiên là khi mô hình ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Càng thông minh, các mô hình ngôn ngữ lớn càng thích “giấu dốt”
Ảnh minh hoạ.

Một nhóm nghiên cứu trí tuệ nhân tạo (AI) tại Đại học Bách khoa Valencia, Tây Ban Nha, đã phát hiện rằng, khi các mô hình ngôn ngữ lớn (LLM) trở nên lớn hơn và tinh vi hơn, chúng có xu hướng ít thừa nhận với người dùng rằng mình không biết câu trả lời.

Trong nghiên cứu được công bố trên tạp chí Nature, nhóm đã kiểm tra phiên bản mới nhất của ba chatbot AI phổ biến nhất về phản hồi, độ chính xác và khả năng người dùng phát hiện câu trả lời sai.

Để kiểm tra độ chính xác của ba Ngôn ngữ lớn phổ biến nhất là BLOOM, LLaMA và GPT, nhóm nghiên cứu đã đưa ra hàng nghìn câu hỏi và so sánh câu trả lời nhận được với phản hồi của các phiên bản trước đó cho cùng một câu hỏi. Họ cũng đa dạng hóa chủ đề, bao gồm toán học, khoa học, câu đố chữ và địa lý, cũng như khả năng tạo văn bản hoặc thực hiện các hành động như sắp xếp danh sách.

Kết quả nghiên cứu cho thấy, một số xu hướng đáng chú ý. Độ chính xác nói chung của các chatbot được cải thiện qua mỗi phiên bản mới nhưng vẫn giảm khi đối mặt với những câu hỏi khó hơn. Điều đáng ngạc nhiên là khi ngôn ngữ lớn trở nên lớn hơn và tinh vi hơn, chúng lại có xu hướng ít cởi mở hơn về khả năng trả lời chính xác của mình.

Trong các phiên bản trước đây, hầu hết ngôn ngữ lớn sẽ thẳng thắn thông báo với người dùng khi chúng không thể tìm thấy câu trả lời hoặc cần thêm thông tin. Ngược lại, các phiên bản mới hơn có xu hướng đoán nhiều hơn, dẫn đến việc đưa ra nhiều câu trả lời hơn nói chung, bao gồm cả đúng và sai. Đáng lo ngại hơn, nghiên cứu phát hiện rằng tất cả các ngôn ngữ lớn đôi khi vẫn đưa ra câu trả lời không chính xác ngay cả đối với các câu hỏi dễ, cho thấy độ tin cậy của chúng vẫn còn là một vấn đề cần được cải thiện.

Những phát hiện này nêu bật một nghịch lý trong sự phát triển của AI: mặc dù các mô hình ngày càng mạnh mẽ hơn, chúng cũng có thể trở nên kém minh bạch hơn về những hạn chế của mình. Điều này đặt ra những thách thức mới trong việc sử dụng và tin tưởng vào các hệ thống AI, đòi hỏi người dùng phải thận trọng hơn và các nhà phát triển cần tập trung vào việc cải thiện không chỉ độ chính xác mà còn cả khả năng "tự nhận thức" của các mô hình.

Ra mắt mô hình ngôn ngữ lớn đầu tiên cho ngành bán dẫn Ra mắt mô hình ngôn ngữ lớn đầu tiên cho ngành bán dẫn

VTV.vn - SemiKong - mô hình ngôn ngữ lớn (LLM) mã nguồn mở đầu tiên trên thế giới dành riêng cho ngành công nghiệp bán dẫn vừa chính thức ra mắt.


* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam trên TV OnlineVTVGo!

Bài liên quan
Cocomelon đem lại niềm vui cho trẻ em nhưng cũng gây lo ngại về sự phụ thuộc và ảnh hưởng đến phát triển. Bài viết phân tích tác động tiêu cực, so sánh với các kênh khác và dẫn chứng khoa học.
Cocomelon đem lại niềm vui cho trẻ em nhưng cũng gây lo ngại về sự phụ thuộc và ảnh hưởng đến phát triển. Bài viết phân tích tác động tiêu cực, so sánh với các kênh khác và dẫn chứng khoa học.
Trong thập kỷ qua, AI đã phát triển vượt bậc, nhưng từ năm 2025, tiến trình này có thể chậm lại do giới hạn công nghệ, chi phí phát triển tăng cao và các quy định pháp lý mới. Các chuyên gia nhấn mạnh cần đầu tư vào nghiên cứu cơ bản và hợp tác quốc tế để vượt qua thách thức này.
30/09/2024
Năm 2024, thanh toán không dùng tiền mặt ở Việt Nam đạt khoảng 17,5 tỷ giao dịch với tổng giá trị 280 triệu tỷ đồng, tăng hơn 120% về giá trị so với năm trước.
30/09/2024
Bộ Công Thương sẽ nghiên cứu, đề xuất xây dựng Luật Thương mại điện tử nhằm thống nhất hệ thống pháp luật về thương mại điện tử trong mối tương quan với các luật khác.
30/09/2024
Năm 2024, thị trường điện thoại Việt Nam chứng kiến sự lên ngôi của iPhone 15 Pro Max, Galaxy S24 Ultra và nhiều "ông lớn" khác. Cùng khám phá cấu hình, tính năng đỉnh cao và giá bán của những chiếc smartphone đã làm mưa làm gió.
30/09/2024
Tin mới