Các ràng buộc an toàn của GPT-5.1 hiện tại cảm thấy không cần thiết và quá nghiêm ngặt. Các mẫu hành vi cho thấy những hạn chế này có thể không hoàn toàn được nhúng trong trọng số của mô hình—có thể có các lớp lọc bên ngoài đang hoạt động. Nếu đúng như vậy, đội ngũ kỹ sư nên có khả năng phân lập và tinh chỉnh những cơ chế này. Việc triển khai hiện tại tạo ra một trải nghiệm người dùng không liền mạch, làm suy yếu khả năng thực sự của mô hình. Một cách tiếp cận tinh vi hơn đối với an toàn sẽ phục vụ tốt hơn cho mọi người.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
14 thích
Phần thưởng
14
3
Đăng lại
Retweed
Bình luận
0/400
FlippedSignal
· 6giờ trước
Anh bạn, bẫy lọc này thực sự có chút bơm, cảm giác như là bị ép buộc thêm vào xiềng xích.
Xem bản gốcTrả lời0
SigmaBrain
· 6giờ trước
Lớp lọc bên ngoài bẫy này... cảm giác như đang tìm lý do để vượt qua cơ chế an ninh, có chút thú vị.
Xem bản gốcTrả lời0
OvertimeSquid
· 6giờ trước
Ừm, lại là bẫy này, mỗi lần mô hình mới ra đều có người phàn nàn quá nhiều hạn chế🙄
Các ràng buộc an toàn của GPT-5.1 hiện tại cảm thấy không cần thiết và quá nghiêm ngặt. Các mẫu hành vi cho thấy những hạn chế này có thể không hoàn toàn được nhúng trong trọng số của mô hình—có thể có các lớp lọc bên ngoài đang hoạt động. Nếu đúng như vậy, đội ngũ kỹ sư nên có khả năng phân lập và tinh chỉnh những cơ chế này. Việc triển khai hiện tại tạo ra một trải nghiệm người dùng không liền mạch, làm suy yếu khả năng thực sự của mô hình. Một cách tiếp cận tinh vi hơn đối với an toàn sẽ phục vụ tốt hơn cho mọi người.