Модель OpenAI 最强o3 была обвинена в подлоге, получив привилегированный доступ к тестовой базе данных FrontierMath заранее

robot
Генерация тезисов в процессе

Согласно информации, опубликованной на форуме LessWrong, подрядчик Epoch AI по имени Meemi сообщил, что OpenAI не только предоставляет финансовую поддержку для тестирования FrontierMath Бенчмарк, но также получает привилегированный доступ к библиотеке тестовых примеров. Возможно, это одна из основных причин значительного повышения результатов o3 в кратчайшие сроки. Это подтверждает, что у o3 есть значительные навыки в продвинутом математическом рассуждении, и доктор математических наук Карина Хонг из Стэнфордского университета заявила, что OpenAI имеет привилегированный доступ к FrontierMath по договоренности с Epoch AI. Однако после обнародования информации подрядчиком, репутация компании резко изменилась. Стоя перед спорным вопросом, заместитель главного исполнительного директора Epoch AI и один из сооснователей Тамай Бесировглу быстро признал это на платформе X. По сообщениям, FrontierMath - это Бенчмарк высокого уровня математического рассуждения с тяжелым весом. Он был создан совместными усилиями Epoch AI и более 60 ведущих математиков, включая нескольких лауреатов премии Филдса и опытных авторов задач Международной математической олимпиады.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить