Согласно информации, опубликованной на форуме LessWrong, подрядчик Epoch AI по имени Meemi сообщил, что OpenAI не только предоставляет финансовую поддержку для тестирования FrontierMath Бенчмарк, но также получает привилегированный доступ к библиотеке тестовых примеров. Возможно, это одна из основных причин значительного повышения результатов o3 в кратчайшие сроки.
Это подтверждает, что у o3 есть значительные навыки в продвинутом математическом рассуждении, и доктор математических наук Карина Хонг из Стэнфордского университета заявила, что OpenAI имеет привилегированный доступ к FrontierMath по договоренности с Epoch AI. Однако после обнародования информации подрядчиком, репутация компании резко изменилась. Стоя перед спорным вопросом, заместитель главного исполнительного директора Epoch AI и один из сооснователей Тамай Бесировглу быстро признал это на платформе X.
По сообщениям, FrontierMath - это Бенчмарк высокого уровня математического рассуждения с тяжелым весом. Он был создан совместными усилиями Epoch AI и более 60 ведущих математиков, включая нескольких лауреатов премии Филдса и опытных авторов задач Международной математической олимпиады.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Модель OpenAI 最强o3 была обвинена в подлоге, получив привилегированный доступ к тестовой базе данных FrontierMath заранее
Согласно информации, опубликованной на форуме LessWrong, подрядчик Epoch AI по имени Meemi сообщил, что OpenAI не только предоставляет финансовую поддержку для тестирования FrontierMath Бенчмарк, но также получает привилегированный доступ к библиотеке тестовых примеров. Возможно, это одна из основных причин значительного повышения результатов o3 в кратчайшие сроки. Это подтверждает, что у o3 есть значительные навыки в продвинутом математическом рассуждении, и доктор математических наук Карина Хонг из Стэнфордского университета заявила, что OpenAI имеет привилегированный доступ к FrontierMath по договоренности с Epoch AI. Однако после обнародования информации подрядчиком, репутация компании резко изменилась. Стоя перед спорным вопросом, заместитель главного исполнительного директора Epoch AI и один из сооснователей Тамай Бесировглу быстро признал это на платформе X. По сообщениям, FrontierMath - это Бенчмарк высокого уровня математического рассуждения с тяжелым весом. Он был создан совместными усилиями Epoch AI и более 60 ведущих математиков, включая нескольких лауреатов премии Филдса и опытных авторов задач Международной математической олимпиады.