RL fine-tuning permet au modèle 4B de surpasser le 235B dans les questions financières : Snorkel AI ouvre l'environnement d'entraînement FinQA

BlockBeatNews

D’après le suivi de 1M AI News, Snorkel AI a publié FinQA, un environnement d’entraînement par renforcement basé sur des documents financiers réels SEC 10-K, qui est désormais open source sur la plateforme OpenEnv, conjointement maintenue par Meta, PyTorch et Hugging Face. FinQA couvre 290 questions-réponses financières annotées par des experts portant sur 22 sociétés cotées (dont Alphabet, Amazon, Apple, Bank of America et Boeing), et fournit à l’agent 4 outils MCP : lister les tables financières disponibles, obtenir la structure des tables, exécuter des requêtes SQL et soumettre des réponses. Les requêtes SQL imposent des contraintes de filtrage et interdisent SELECT *, obligeant l’agent à ne récupérer que les données nécessaires, plutôt que de vider l’intégralité d’une table.

Snorkel AI et l’équipe rLLM de l’université de Californie à Berkeley ont collaboré : avec FinQA, ils ont effectué un fine-tuning par apprentissage par renforcement de Qwen3-4B. Les résultats atteignent 59,7 % sur le benchmark de questions-réponses financières SnorkelFinance, dépassant Qwen3-235B de la même série (51,37 %). Le nombre de paramètres est d’environ 1/60 de celui de ce dernier, et le coût d’inférence diminue d’environ 90 %. Résultats clés : les grands modèles peuvent raisonner, mais produisent des noms de colonnes inventés et ignorent les contraintes SQL ; après l’entraînement RL, le petit modèle peut au contraire appeler les outils avec précision. C’est la « discipline des outils », plutôt que la taille, qui constitue le goulot d’étranglement.

FinQA est le premier environnement open source publié par Snorkel AI sur OpenEnv ; par la suite, d’autres environnements multi-tours pour des entreprises seront lancés, couvrant des secteurs comme la santé, l’assurance et le droit.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire