D’après le suivi de 1M AI News, Snorkel AI a publié FinQA, un environnement d’entraînement par renforcement basé sur des documents financiers réels SEC 10-K, qui est désormais open source sur la plateforme OpenEnv, conjointement maintenue par Meta, PyTorch et Hugging Face. FinQA couvre 290 questions-réponses financières annotées par des experts portant sur 22 sociétés cotées (dont Alphabet, Amazon, Apple, Bank of America et Boeing), et fournit à l’agent 4 outils MCP : lister les tables financières disponibles, obtenir la structure des tables, exécuter des requêtes SQL et soumettre des réponses. Les requêtes SQL imposent des contraintes de filtrage et interdisent SELECT *, obligeant l’agent à ne récupérer que les données nécessaires, plutôt que de vider l’intégralité d’une table.
Snorkel AI et l’équipe rLLM de l’université de Californie à Berkeley ont collaboré : avec FinQA, ils ont effectué un fine-tuning par apprentissage par renforcement de Qwen3-4B. Les résultats atteignent 59,7 % sur le benchmark de questions-réponses financières SnorkelFinance, dépassant Qwen3-235B de la même série (51,37 %). Le nombre de paramètres est d’environ 1/60 de celui de ce dernier, et le coût d’inférence diminue d’environ 90 %. Résultats clés : les grands modèles peuvent raisonner, mais produisent des noms de colonnes inventés et ignorent les contraintes SQL ; après l’entraînement RL, le petit modèle peut au contraire appeler les outils avec précision. C’est la « discipline des outils », plutôt que la taille, qui constitue le goulot d’étranglement.
FinQA est le premier environnement open source publié par Snorkel AI sur OpenEnv ; par la suite, d’autres environnements multi-tours pour des entreprises seront lancés, couvrant des secteurs comme la santé, l’assurance et le droit.