Nhóm nghiên cứu của Đại học Zhejiang đề xuất con đường mới: dạy AI cách hiểu thế giới của não người

robot
Đang tạo bản tóm tắt

null

Các mô hình lớn liên tục ngày càng to hơn. Quan điểm chủ đạo cho rằng các tham số của mô hình càng nhiều thì nó càng tiến gần đến cách con người suy nghĩ. Tuy nhiên, một bài báo do nhóm của Đại học Chiết Giang công bố trên Nature Communications vào ngày 1/4 lại đưa ra một quan điểm khác (liên kết nguyên văn: Sau khi tăng từ 22 triệu lên 304,37 triệu, đối với nhiệm vụ khái niệm cụ thể thì tỷ lệ tăng từ 74,94% lên 85,87%, còn nhiệm vụ khái niệm trừu tượng giảm từ 54,37% xuống 52,82%.

Sự khác biệt giữa cách con người và mô hình suy nghĩ

Khi não người xử lý các khái niệm, trước tiên sẽ hình thành một hệ thống quan hệ phân loại. Thiên nga và cú trông không giống nhau, nhưng con người vẫn xếp chúng vào cùng một nhóm “chim”. Lên cao hơn nữa, chim và ngựa cũng có thể tiếp tục được xếp vào tầng “động vật” đó. Khi con người nhìn thấy một thứ mới, thường sẽ nghĩ trước rằng nó giống với thứ gì mà mình đã từng thấy trước đây, và đại khái nó thuộc nhóm nào. Con người liên tục học các khái niệm mới, rồi tổ chức kinh nghiệm lại, dùng hệ thống quan hệ này để nhận diện các sự vật mới và thích nghi với bối cảnh mới.

Mô hình cũng có phân loại, nhưng cách hình thành lại khác. Nó chủ yếu dựa vào các dạng thức xuất hiện lặp đi lặp lại trong lượng lớn dữ liệu. Đối tượng nào xuất hiện càng nhiều thì mô hình càng dễ nhận ra nó. Đến bước phân vào các lớp lớn hơn, mô hình sẽ khá “vất vả”. Nó cần nắm bắt các điểm chung giữa nhiều đối tượng, rồi quy các điểm chung đó vào cùng một lớp. Các mô hình hiện có ở đây vẫn còn những điểm yếu rõ rệt. Khi tiếp tục tăng quy mô tham số, nhiệm vụ khái niệm cụ thể sẽ được cải thiện, còn đôi khi nhiệm vụ khái niệm trừu tượng lại bị giảm.

Điểm chung của não người và mô hình là cả hai đều hình thành một hệ thống quan hệ phân loại bên trong. Nhưng trọng tâm của hai bên khác nhau: vùng thị giác cấp cao của não người sẽ tự nhiên phân chia các nhóm lớn như sinh vật và phi sinh vật. Trong khi đó, mô hình có thể tách biệt các đối tượng cụ thể, nhưng khó có thể ổn định hình thành các nhóm lớn hơn kiểu như vậy. Sự khác biệt này khiến não người dễ áp dụng kinh nghiệm cũ lên các đối tượng mới hơn, nên khi đối mặt với những thứ chưa từng gặp, chúng ta có thể phân loại nhanh. Còn mô hình lại phụ thuộc nhiều hơn vào kiến thức sẵn có, vì vậy khi gặp đối tượng mới, nó dễ dừng ở các đặc trưng bề mặt. Phương pháp mà bài báo đề xuất chính là triển khai xoay quanh đặc điểm này: dùng tín hiệu não để ràng buộc cấu trúc bên trong của mô hình, khiến nó tiến gần hơn đến cách phân loại của não người.

Giải pháp của nhóm Đại học Chiết Giang

Giải pháp nhóm đưa ra cũng rất độc đáo: không phải tiếp tục “chồng” thêm tham số, mà là dùng một lượng nhỏ tín hiệu não để giám sát. Những tín hiệu não này đến từ việc ghi lại hoạt động não khi con người nhìn vào hình ảnh. Bài báo viết nguyên văn là: “transfer human conceptual structures to DNNs”. Ý là truyền cho mô hình cách con người phân loại, cách quy nạp, và cách đặt các khái niệm gần nhau vào cùng một nhóm, ở mức tối đa có thể.

Nhóm dùng 150 nhóm lớp huấn luyện đã biết và 50 nhóm lớp kiểm thử chưa từng thấy để làm thí nghiệm. Kết quả cho thấy, khi quá trình huấn luyện này tiến triển, khoảng cách giữa mô hình và biểu diễn trong não tiếp tục thu hẹp. Sự thay đổi này đồng thời xuất hiện ở cả hai nhóm lớp, điều này cho thấy mô hình không học từng mẫu đơn lẻ, mà thật sự bắt đầu học một phương thức tổ chức khái niệm giống hơn với não người.

Sau quá trình huấn luyện này, mô hình có năng lực học tốt hơn khi lượng mẫu rất ít, và khi gặp tình huống mới thì cũng thể hiện tốt hơn. Trong một nhiệm vụ chỉ cung cấp rất ít ví dụ, nhưng yêu cầu mô hình phân biệt các khái niệm trừu tượng như sinh vật và phi sinh vật, mô hình trung bình tăng 20,5%, và còn vượt cả các mô hình đối chứng có lượng tham số lớn hơn nhiều. Nhóm cũng thực hiện thêm 304.37Mộ kiểm thử chuyên biệt; ở một số mô hình khác nhau, đều xuất hiện mức cải thiện gần một phần mười.

Trong vài năm qua, con đường quen thuộc với ngành mô hình là quy mô mô hình lớn hơn. Nhóm Đại học Chiết Giang lại chọn một hướng khác, từ “bigger is better” chuyển sang “structured is smarter”. Việc mở rộng quy mô chắc chắn có ích, nhưng chủ yếu là nâng hiệu suất trong các nhiệm vụ quen thuộc. Năng lực hiểu và chuyển giao trừu tượng của con người đối với AI cũng quan trọng không kém; điều này cần trong tương lai làm cho cấu trúc suy nghĩ của AI giống hơn với não người. Giá trị của hướng đi này nằm ở chỗ nó kéo sự chú ý của ngành từ việc chỉ mở rộng quy mô thuần túy, quay trở lại chính cấu trúc nhận thức.

Neosoul và tương lai

Điều này mở ra một khả năng lớn hơn: sự tiến hóa của AI có lẽ không chỉ diễn ra ở giai đoạn huấn luyện mô hình. Huấn luyện mô hình có thể quyết định AI sẽ tổ chức khái niệm như thế nào, và sẽ hình thành cấu trúc phán đoán chất lượng cao ra sao. Sau khi đi vào thế giới thực, một lớp tiến hóa khác của AI mới chỉ bắt đầu: các phán đoán của AI agent sẽ được ghi nhận như thế nào, được kiểm chứng ra sao, và sẽ tiếp tục lớn lên tiến hóa trong sự cạnh tranh tương tác thực tế—giống như con người tự học, tự tiến hóa. Và đây chính là điều Neosoul hiện đang làm. Neosoul không chỉ khiến AI agent tạo ra câu trả lời, mà đưa AI agent vào một hệ thống liên tục dự đoán, liên tục xác minh, liên tục quyết toán và liên tục sàng lọc, để nó không ngừng tối ưu bản thân giữa dự đoán và kết quả, giữ lại cấu trúc tốt hơn và loại bỏ cấu trúc kém hơn. Thứ mà nhóm Đại học Chiết Giang và Neosoul cùng hướng tới thực ra là cùng một mục tiêu: làm cho AI không chỉ biết làm bài, mà còn phải có năng lực suy nghĩ toàn diện, và tiếp tục tiến hóa.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.22KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.23KNgười nắm giữ:1
    0.00%
  • Ghim