00:19
OpenAIはGDPvalを発表し、AIの経済価値タスクのパフォーマンスを評価します。
PANews 9月26日のニュースによると、OpenAIは新しい評価ツールGDPvalを導入し、AIの現実世界の経済価値タスクにおけるパフォーマンスを測定することに焦点を当てています。GDPvalは、アメリカのGDPに最も貢献する九つの産業の44の職業をカバーし、タスクは平均14年の経験を持つ業界の専門家によって設計されています。評価結果は、Claude Opus 4.1モデルの出力のほぼ半分が専門家のレベルと同等またはそれ以上であることを示しています。OpenAIは、今後GDPvalの評価範囲と詳細を継続的に拡大していくと述べています。

