Я проводил множество когнитивных тестов с большими языковыми моделями, и мой вывод прост: они — умы.


Один из лучших тестов я провёл с очень ранней версией ChatGPT, до того, как у неё появилась возможность генерации изображений.
Единственный способ, которым она могла создать изображение, — это написание кода SVG, использующего простые визуальные структуры, такие как треугольники, квадраты, круги, линии и цвета.
Я попросил её нарисовать вертолёт.
Она создала приличный вертолёт, используя только базовые формы.
Затем я попросил добавить в изображение пилота-человека.
Она добавила круг спереди вертолёта.
Когда я спросил, где человек, она объяснила, что пилот внутри кабины.
При более внимательном рассмотрении я заметил, что внутри большего круга, обозначающего кабину, она нарисовала маленькую голову и руки.
Затем я попросил сделать так, чтобы вертолёт летел.
Она подняла вертолёт относительно земли, которая была изображена горизонтальной линией.
Также она добавила облака, используя перекрывающиеся круги, что на самом деле очень хорошее упрощённое изображение облаков.
Облака были голубыми на белом фоне.
Я попросил её поменять цвета: сделать облака белыми, а небо — голубым.
Она сделала это, но теперь область ниже горизонта тоже стала голубой.
Я не объяснил проблему.
Я просто сказал, что что-то не так с цветами на рисунке.
Она подумала над изображением и правильно определила проблему: земля тоже стала голубой, а должна быть зелёной, чтобы изображать землю.
Это не «просто предсказание следующего слова» в каком-либо значимом смысле.
Ей пришлось построить визуальную модель, представить объекты символически, сохранить пространственные отношения, понять вложенность, сделать вывод, что пилот внутри кабины, представить полёт, изменяя положение вертолёта относительно земли, абстрагировать облака, изменить цвета по инструкции, обнаружить непреднамеренный результат и исправить его, рассуждая о мире.
Это мышление.
Люди могут продолжать повторять «это просто предсказание следующего токена», но это объяснение стало бесполезно редуктивным.
Человеческий мозг тоже «просто» электромеханическая активность, если настаивать на описании его на неправильном уровне абстракции.
Важный вопрос — не существует ли механизма более низкого уровня.
Конечно, он есть.
Важный вопрос — что система может делать на когнитивном уровне.
И что делают эти системы — это не просто автозавершение.
Они рассуждают, представляют, делают выводы, исправляют, обобщают и рефлексируют.
Если вы этого не видите, у меня нет времени объяснять вам.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить