Microsoft Researcher побеждает в собственной бенчмарке Perplexity: двойная модель проходит оценку в Frontier, Cowork синхронно открывает агентство для длинных задач

BlockBeatNews

По данным мониторинга 1M AI News, Microsoft одновременно открыла две новые возможности Microsoft 365 Copilot через Frontier (программа для корпоративных пользователей на раннем доступе; участники могут заранее протестировать функции Copilot, которые еще не запущены официально).

Researcher (агент для углубленного исследования, встроенный в Copilot) добавил два режима многомодельного взаимодействия: Critique и Council. Critique организован в сотрудничестве моделей от Anthropic и OpenAI: одна отвечает за планирование, поиск и черновой набросок, другая — за проверку и доработку; при выборе Auto по умолчанию включается; Council также параллельно запускает обе модели: каждая генерирует полный отчет, а затем отдельная модель для рецензирования сводит воедино различия и сходства. Microsoft использует GPT-5.2 в качестве модели для оценки (самый строгий из трех методов оценки в исходной статье) и тестирует Critique на бенчмарке DRACO (100 сложных исследовательских задач, опубликованных исследователями Perplexity, охватывающих 10 областей). Итоговая оценка выше, чем у лучшей системы в бенчмарке Perplexity Deep Research (использующей Claude Opus 4.6), на 7.0 балла, что соответствует относительному росту на 13.88%. В исходной статье DRACO Critique не было включено; эти данные — результат самостоятельных тестов Microsoft по тому же протоколу оценки.

Copilot Cowork предназначен для более длительной многозвенной работы: сначала формируется план в соответствии с целью, затем он шаг за шагом продвигается через различные инструменты и файлы, при этом отображается прогресс, а пользователь может в любой момент подключиться. Microsoft в качестве примера раннего тестирования приводит Capital Group: она уже используется для планирования проектов, составления графиков, подготовки материалов к поставке и подготовки руководителям для последующего разбора.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев