RL-тонкая настройка позволяет модели 4B превзойти 235B в финансовых вопросах и ответах: открытая среда обучения FinQA от Snorkel AI

BlockBeatNews

По данным мониторинга 1M AI News, Snorkel AI выпустила FinQA — среду для обучения с подкреплением, усиленную контекстом реальных финансовых документов SEC 10-K, которая уже открыта исходно на платформе OpenEnv, совместно поддерживаемой Meta, PyTorch и Hugging Face. FinQA включает 290 задач по финансовым вопросам с экспертной разметкой по 22 публичным компаниям (включая Alphabet, Amazon, Apple, Bank of America, Boeing) и предоставляет агенту 4 инструмента MCP: перечислить доступные финансовые таблицы, получить структуру таблицы, выполнить SQL-запрос и отправить ответ. SQL в обязательном порядке требует фильтрующих условий и запрещает SELECT *, заставляя агента выбирать только нужные данные, а не выгружать целиком всю таблицу.

Snorkel AI в сотрудничестве с командой rLLM из Калифорнийского университета в Беркли использовала FinQA для подкрепляющего обучения и точной настройки Qwen3-4B; результаты на бенчмарке финансовых вопросов и ответов SnorkelFinance составили 59.7%, что выше, чем у Qwen3-235B той же серии (51.37%). Объём параметров — примерно 1/60 по сравнению с последним, а стоимость инференса снизилась примерно на 90%. Ключевой вывод: большие модели умеют рассуждать, но производят галлюцинации в названиях столбцов и игнорируют ограничения SQL; после RL-тренировки небольшие модели, напротив, способны точно вызывать инструменты — «дисциплина инструментов», а не масштаб, является узким местом.

FinQA — это первый открытый исходный environment, опубликованный Snorkel AI на OpenEnv; в дальнейшем будут выпущены многораундовые environments для предприятий, охватывающие такие отрасли, как медицина, страхование и право.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев