Microsoft Researcher побеждает в собственной бенчмарке Perplexity: двойная модель проходит оценку в Frontier, Cowork синхронно открывает агентство для длинных задач

BlockBeatNews

2026-03-31 06:20:45

По данным мониторинга 1M AI News, Microsoft одновременно открыла две новые возможности Microsoft 365 Copilot через Frontier (программа для корпоративных пользователей на раннем доступе; участники могут заранее протестировать функции Copilot, которые еще не запущены официально).

Researcher (агент для углубленного исследования, встроенный в Copilot) добавил два режима многомодельного взаимодействия: Critique и Council. Critique организован в сотрудничестве моделей от Anthropic и OpenAI: одна отвечает за планирование, поиск и черновой набросок, другая — за проверку и доработку; при выборе Auto по умолчанию включается; Council также параллельно запускает обе модели: каждая генерирует полный отчет, а затем отдельная модель для рецензирования сводит воедино различия и сходства. Microsoft использует GPT-5.2 в качестве модели для оценки (самый строгий из трех методов оценки в исходной статье) и тестирует Critique на бенчмарке DRACO (100 сложных исследовательских задач, опубликованных исследователями Perplexity, охватывающих 10 областей). Итоговая оценка выше, чем у лучшей системы в бенчмарке Perplexity Deep Research (использующей Claude Opus 4.6), на 7.0 балла, что соответствует относительному росту на 13.88%. В исходной статье DRACO Critique не было включено; эти данные — результат самостоятельных тестов Microsoft по тому же протоколу оценки.

Copilot Cowork предназначен для более длительной многозвенной работы: сначала формируется план в соответствии с целью, затем он шаг за шагом продвигается через различные инструменты и файлы, при этом отображается прогресс, а пользователь может в любой момент подключиться. Microsoft в качестве примера раннего тестирования приводит Capital Group: она уже используется для планирования проектов, составления графиков, подготовки материалов к поставке и подготовки руководителям для последующего разбора.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

комментарий

0/400

Нет комментариев