За моніторингом 1M AI News, Snorkel AI випустила FinQA — середовище для навчання з підкріпленням, побудоване на основі реальних фінансових документів SEC 10-K, яке вже відкрито як вихідний код на платформі OpenEnv, спільно підтримуваній Meta, PyTorch і Hugging Face. FinQA охоплює 290 експертно анотованих фінансових запитань і відповідей для 22 публічних компаній (зокрема Alphabet, Amazon, Apple, Bank of America, Boeing) і надає агенту 4 інструменти MCP: перелічити доступні фінансові таблиці, отримати структуру таблиці, виконати SQL-запит, надіслати відповідь. У SQL обов’язково мають бути фільтрувальні умови, а також заборонено SELECT * — це змушує агента брати лише потрібні дані, а не скидати всю таблицю.
Snorkel AI співпрацює з командою rLLM Університету Каліфорнії в Берклі, щоб за допомогою FinQA виконати підкріплювальне навчальне доопрацювання Qwen3-4B. У результаті на бенчмарку фінансових запитань і відповідей SnorkelFinance показник становить 59,7%, що вище, ніж у Qwen3-235B тієї ж лінійки (51,37%), а обсяг параметрів — приблизно 1/60 від останнього; витрати на інференс знижено приблизно на 90%. Ключові висновки: великі моделі можуть виконувати міркування, але створюють галюцинації назв колонок і ігнорують обмеження SQL; після RL-навчання малі моделі натомість здатні точно викликати інструменти — «дисципліна інструментів», а не масштаб, і є вузьким місцем.
FinQA — перше відкрите середовище Snorkel AI, опубліковане в OpenEnv; надалі буде представлено багатоетапні середовища підприємств, що охоплюватимуть такі галузі, як медицина, страхування, право тощо.