
How GitHub Deals with 17 Million Pull Requests a Month
Audio Summary
AI Summary
Mike Taylor, responsable du conseil technologique chez Every, s'est entretenu avec Kyle Dagel, COO de GitHub, pour discuter de l'évolution des agents de codage. GitHub reçoit 17 millions de requêtes de tirage par mois, un chiffre en croissance exponentielle, ce qui place l'entreprise à l'avant-garde de la nouvelle économie de l'IA. L'entretien a abordé l'impact sur les utilisateurs et les mainteneurs de l'open source, ainsi que la gestion des coûts des abonnements aux agents de codage, qui peuvent passer de 200 $ à 2 000 $ par mois. Taylor a révélé avoir utilisé un clone IA de Dagel pour préparer l'interview, ce à quoi Dagel a répondu par une anecdote surprenante concernant sa propre utilisation d'agents IA pour l'auto-amélioration.
Dagel a expliqué que la démographie des utilisateurs de GitHub évolue. De nombreuses personnes qui n'avaient jamais utilisé GitHub ou des produits de développement auparavant s'y mettent désormais. GitHub a toujours eu une vision large de ce qu'est un développeur. Dagel a partagé son expérience personnelle, où il écrivait du code pour lui-même avant de se considérer comme un développeur. Aujourd'hui, des équipes juridiques et financières de GitHub, ainsi que des travailleurs du savoir chez leurs clients, utilisent GitHub Copilot pour créer de petites applications ou des ressources. Bien que GitHub reste axé sur les développeurs, l'entreprise souhaite faciliter l'accès au codage pour tous, notamment avec des outils comme GitHub Copilot.
Concernant la charge de travail accrue pour les mainteneurs open source due à l'afflux de requêtes de tirage (PR), Dagel a mentionné des outils comme la révision de code Copilot, qui est désormais "agentic" et peut identifier des vulnérabilités inédites, et même implémenter des changements suggérés. La fusion "agentic" dans l'application aide à automatiser les étapes manuelles après une révision de code. Pour les mainteneurs open source, l'enjeu est unique car ils ne contrôlent pas qui soumet les contributions. GitHub vise à leur donner plus d'outils pour décider d'accepter ou non les PR, et de qui elles proviennent, tout en leur laissant le contrôle total. L'entreprise ne souhaite pas imposer de normes, mais plutôt fournir des "blocs de construction" et observer quelles pratiques émergent de la communauté.
L'économie des agents est en pleine explosion. Dagel a noté que le nombre de requêtes de tirage soumises par mois dépasse déjà le total de l'année précédente. En mars, 17 millions de PR ont été créées par des agents. Le volume de code généré est immense. GitHub investit massivement pour se préparer à cette prochaine vague de croissance, car toute cette activité de codage finit par se retrouver sur GitHub.
Le modèle économique de GitHub évolue également. Dans un monde où les agents travaillent pendant que les humains dorment, le modèle freemium pourrait changer vers une tarification basée sur l'utilisation. Dagel a expliqué que l'objectif est de permettre aux utilisateurs de faire beaucoup plus, par exemple avec 150 agents travaillant simultanément, tout en garantissant une excellente expérience GitHub de base. Historiquement, GitHub a évolué pour offrir des dépôts privés gratuits aux individus, et l'entreprise continuera d'adapter son offre aux besoins des développeurs et des entreprises.
Dagel a également parlé de son double rôle de COO de GitHub et de Chief Marketing Officer pour les développeurs chez Microsoft. Son objectif en tant que COO est de rester concentré sur les développeurs, en construisant des outils pour eux et non pour les acheteurs. En tant que CMO, il s'assure que l'ensemble des outils et technologies de Microsoft offre des solutions holistiques et authentiques pour les développeurs. Il a souligné l'approche différente de la conférence Build de cette année, axée sur l'utilisation pratique des outils et l'implication de la communauté. Pour la première fois, Build a invité des conférenciers externes de la communauté dans ses sessions principales, reflétant la conviction que le développement logiciel est un sport d'équipe et qu'une seule entreprise ne peut pas répondre à toutes les questions.
Dans un marché très compétitif et en évolution rapide, GitHub se différencie en se concentrant sur le choix du développeur et l'habilitation des constructeurs. L'entreprise souhaite permettre aux développeurs d'utiliser GitHub avec d'autres outils, en collaborant avec tous les partenaires pour simplifier cette intégration. GitHub investit dans sa propre technologie (modèles d'IA Microsoft) tout en s'associant avec des acteurs comme Anthropic, OpenAI et Google pour offrir un large éventail de modèles et d'agents de codage. Le choix est fondamental et GitHub ne reculera jamais sur ce principe, car sans cela, les développeurs se retrouveraient piégés dans d'autres "souricières" logicielles.
Concernant les décisions internes, Dagel a abordé l'équilibre entre l'utilisation de leurs propres produits ("dogfooding") et l'expérimentation avec d'autres outils. Il a expliqué qu'il utilise lui-même une variété de systèmes (Mac, PC Windows, Linux) pour comprendre l'expérience des développeurs sur différentes plateformes. Par exemple, il n'utilise l'application GitHub Copilot que sur Windows pour s'assurer que les utilisateurs Windows bénéficient d'excellentes applications. Cette culture d'expérimentation est cruciale pour éviter les angles morts. Même si l'énergie est principalement dirigée vers leurs propres outils, il est essentiel de comprendre pourquoi d'autres outils sont appréciés par les développeurs.
La stratégie de GitHub est à la fois à court terme et à long terme. À court terme, il s'agit de gérer la multitude de sessions d'agents. À long terme, les modèles continueront de s'améliorer, et l'économie des jetons deviendra un facteur clé. Dagel estime que nous sommes proches de pouvoir utiliser des modèles de langage plus grands sur des appareils locaux. L'idée de personnalisation, de contexte et de mémoire est une constante depuis l'avènement de ChatGPT et GitHub Copilot. L'objectif est de permettre aux utilisateurs d'utiliser efficacement de nombreux agents, et d'offrir une expérience où l'agent "complète une pensée" pour l'utilisateur sans que celui-ci ait à la codifier.
La technique du "hill climbing" (escalade de colline), mentionnée par Satya Nadella et d'autres, est un axe majeur. Il s'agit d'utiliser l'usage des outils comme moyen d'améliorer les modèles sous-jacents. Chaque semaine, les résultats du "hill climbing" sont analysés, en tenant compte des mesures quantitatives et qualitatives. L'objectif est de fournir à chacun ces "machines à escalader les collines", en particulier aux entreprises qui peuvent tirer parti de leurs vastes données (documents, chats) pour des réglages de modèles personnalisés, comme le "Frontier Tuning" avec des modèles de base comme MAI thinking one. Dagel a d'abord été sceptique, pensant qu'il s'agissait d'une "astuce de prestidigitateur", mais a réalisé que la simplicité d'utilisation des données pour s'améliorer est là où réside la valeur.
Cette approche est également la clé pour maîtriser les coûts des abonnements aux agents. Plutôt que de choisir le modèle le plus cher, les outils peuvent automatiquement router les requêtes vers le modèle le plus approprié en fonction de la complexité de la tâche. Dagel a donné l'exemple d'un agent effectuant une tâche complexe, suivie d'une petite modification simple qui ne nécessite pas un modèle coûteux. Les outils peuvent gérer cette transition, ce qui permettra des économies significatives pour les entreprises et les développeurs individuels.
Enfin, Dagel a partagé qu'il utilise des agents IA de manière similaire à Taylor pour l'auto-amélioration. Il a un "claw" (un agent) qui lit tout ce qu'il écrit (e-mails, messages Slack) et lui fournit un "rapport de communication" quotidien, soulignant les répétitions ou les formulations peu claires. Il trouve que les humains sont plus enclins à accepter des critiques de robots que d'autres humains, ce qui rend cette boucle d'auto-amélioration incroyablement puissante. Son agent, affectueusement nommé Baxter, lui donne des retours sur ses performances, ce qui l'aide à améliorer ses communications. Cette boucle est "super super super puissante" et correspond à l'expérience consommateur personnelle qu'il attend de l'IA.