Un ingénieur d'OpenAI utilise Codex pour automatiser sa propre évaluation de performance

robot
Création du résumé en cours

Titre

L’ingénieur d’OpenAI Jason Liu montre Codex automatisant sa préparation de révision de performance en utilisant Slack et Gmail.

Résumé

Jason Liu, qui a récemment rejoint OpenAI en tant qu’ingénieur ML senior, a posté un tweet montrant Codex s’occupant d’une tâche vraiment fastidieuse : assembler un paquet promotionnel pour la révision de performance. Liu a créé Instructor, une bibliothèque Python pour des sorties LLM structurées qui obtient plus de 6 millions de téléchargements par mois et a influencé les propres fonctionnalités de sortie structurée d’OpenAI. Dans la démonstration, il a demandé à Codex de tirer des informations de Slack et Gmail pour assembler le document. C’est un petit exemple, mais il montre vers où ces outils se dirigent : gérer le travail administratif ennuyeux en plusieurs étapes qui consomme le temps des ingénieurs.

Analyse

Liu n’est pas n’importe quel ingénieur qui parle des outils d’IA. Il a construit Instructor, qui est devenu assez populaire pour qu’OpenAI intègre des idées similaires dans leurs sorties structurées. Maintenant qu’il est dans l’entreprise, ce tweet ressemble à quelqu’un qui utilise ses propres outils pour un travail réel plutôt qu’à une démonstration polie.

L’aspect intéressant est le côté multi-outils. Codex ne génère pas seulement du code ici : il coordonne entre Slack et Gmail, rassemblant des informations et assemblant quelque chose d’utile. C’est plus proche de la manière dont les gens travaillent réellement : passer d’un outil à l’autre, rassemblant le contexte, le synthétisant en quelque chose de cohérent. OpenAI a poussé les plugins et les automatisations en arrière-plan, et cela s’inscrit dans cette direction.

Il y a aussi un angle personnel. Liu a parlé d’utiliser l’IA pour revenir au travail technique après une blessure à la main. Donc, quand il démontre quelque chose comme ça, il y a une qualité de “j’en ai vraiment besoin”.

Les questions évidentes : à quel point cela fonctionne-t-il lorsque la tâche est plus désordonnée ? Que se passe-t-il avec des données sensibles circulant à travers ces intégrations ? Mais en tant que preuve de concept pour l’IA gérant le travail administratif de base, c’est concret.

Évaluation de l’impact

  • Signification : Moyenne
  • Catégories : Outils pour développeurs, Perspicacité technique, Tendance de l’industrie
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler