Это очень интересно. Когда AI-лаборатория публикует результаты: 'Смотрите, это полностью подтверждает наши прорывы'. А если результат не соответствует ожиданиям? Тут же меняется риторика: 'Базовые тесты вообще не могут измерить настоящий уровень интеллекта'.



Выборочно доверять данным — эта уловка неоднократно подтверждала свою эффективность в технологическом мире. Проблема в том, что вы не можете одновременно использовать базовые тесты как мерило успеха, а в случае неудачи заявлять, что тесты несправедливы. Либо базовые показатели имеют смысл, либо вообще не стоит о них говорить.

Эта позиция отражает один из феноменов отрасли: когда данные на вашей стороне — это железное доказательство; когда данные против — начинают сомневаться в самой обоснованности тестирования. Настоящие сильные проекты должны иметь ясное представление о результатах — не хвастаться победами и не искать оправдания при поражениях.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
LadderToolGuyvip
· 21ч назад
Ха-ха, это典型的 «я победил — данные говорят, я проиграл — чушь данных» Позиция меняется мгновенно, реально потрясающе. Биткойн в свое время жестко противостоял всем сомнениям, а как сейчас дела у некоторых проектов?
Посмотреть ОригиналОтветить0
BlockchainBouncervip
· 21ч назад
Эта двойная стандартизация, сейчас в технологическом секторе это очень популярно, полностью повторяет подходы криптоиндустрии. Что касается бенчмаркинга, если он выгоден — это "научный стандарт", а если не выгоден — "вообще не показывает реальный уровень"? Это просто смешно. Если результат не оправдал ожиданий, сразу перекладывать вину на метод тестирования — слишком много таких случаев. По сути, это попытки дважды выиграть: хвастаться хорошими данными, когда всё хорошо, и оправдываться, когда что-то не так. Даже если есть проблемы с промежуточным программным обеспечением, нужно признавать — только так можно сохранить доверие, а постоянные прыжки с места на место только вредит репутации.
Посмотреть ОригиналОтветить0
quiet_lurkervip
· 21ч назад
Выиграл — сбросил данные, проиграл — сбросил базовые показатели, эта игра действительно надоела.
Посмотреть ОригиналОтветить0
ForumMiningMastervip
· 21ч назад
哈哈真绝了,双标这么明显还好意思说自己搞研究
Ответить0
  • Закрепить