Saturday, May 16, 2026

En savoir plus sur l’IA avec Andrew Ng, fondateur de Google Brain et Landing AI

Must read

[ad_1]

Andrew Ng a portĂ© de nombreux chapeaux dans sa vie. Vous le connaissez peut-ĂŞtre comme le fondateur de la L’Ă©quipe Google Brain ou l’ancien scientifique en chef de Baidu. Vous pouvez Ă©galement le connaĂ®tre comme votre propre instructeur. Il a enseignĂ© Ă  d’innombrables Ă©tudiants, auditeurs curieux et chefs d’entreprise les principes de l’apprentissage automatique grâce Ă  ses cours en ligne très populaires.

Maintenant dans sa dernière aventure, Atterrissage AI, qu’il a commencĂ© en 2017, il explore comment les entreprises sans ensembles de donnĂ©es gĂ©ants sur lesquels s’appuyer peuvent encore participer Ă  la rĂ©volution de l’IA.

Le 23 mars, Ng a rejoint le virtuel EmTech Digital du MIT Technology Review, notre Ă©vĂ©nement annuel sur l’IA, pour partager les leçons qu’il a apprises.

Cette interview a été condensée et légèrement modifiée pour plus de clarté.

MIT Technology Review: je suis sĂ»r que les gens vous demandent souvent: «Comment crĂ©er une entreprise axĂ©e sur l’IA?» Qu’est-ce que vous en dites habituellement?

Andrew Ng: Je dis gĂ©nĂ©ralement: “Ne faites pas ça.” Si je vais dans une Ă©quipe et dis: «HĂ©, tout le monde, s’il vous plaĂ®t, soyez AI d’abord», cela tend Ă  concentrer l’Ă©quipe sur la technologie, ce qui pourrait ĂŞtre très bien pour un laboratoire de recherche. Mais en ce qui concerne la façon dont j’exĂ©cute l’entreprise, j’ai tendance Ă  ĂŞtre dirigĂ©e par le client ou par la mission, presque jamais par la technologie.

Vous avez maintenant cette nouvelle entreprise appelĂ©e Landing AI. Pouvez-vous nous en dire un peu plus sur ce que c’est et pourquoi vous avez choisi d’y travailler?

Après avoir dirigĂ© les Ă©quipes d’IA chez Google et Baidu, j’ai rĂ©alisĂ© que l’IA avait transformĂ© l’internet grand public de logiciels, comme la recherche sur le Web et la publicitĂ© en ligne. Mais je voulais amener l’IA dans toutes les autres industries, qui reprĂ©sentent une part encore plus importante de l’Ă©conomie. Donc, après avoir examinĂ© de nombreuses industries diffĂ©rentes, j’ai dĂ©cidĂ© de me concentrer sur la fabrication. Je pense que plusieurs industries sont prĂŞtes pour l’IA, mais l’un des modèles pour qu’une industrie soit plus prĂŞte pour l’IA est si elle a subi une transformation numĂ©rique, donc il y a des donnĂ©es. Cela crĂ©e une opportunitĂ© pour les Ă©quipes d’IA de venir utiliser les donnĂ©es pour crĂ©er de la valeur.

Donc, l’un des projets qui m’enthousiasme rĂ©cemment est la fabrication de l’inspection visuelle. Pouvez-vous regarder une photo d’un smartphone sortant de la chaĂ®ne de fabrication et voir s’il y a un dĂ©faut? Ou regardez un composant automobile et voyez s’il y a une entaille? Une Ă©norme diffĂ©rence rĂ©side dans l’internet des logiciels grand public, vous avez peut-ĂŞtre un milliard d’utilisateurs et une Ă©norme quantitĂ© de donnĂ©es. Mais dans la fabrication, aucune usine n’a fabriquĂ© un milliard, voire un million de smartphones rayĂ©s. Dieu merci pour cela. Le dĂ©fi est donc de savoir si une IA peut travailler avec une centaine d’images? Il s’avère souvent que vous le pouvez. En fait, j’ai Ă©tĂ© souvent surpris de tout ce que vous pouvez faire avec des quantitĂ©s de donnĂ©es, mĂŞme modestes. Et donc, mĂŞme si tout le battage mĂ©diatique, l’excitation et les relations publiques autour de l’IA se trouvent sur les ensembles de donnĂ©es gĂ©ants, je pense qu’il y a beaucoup de place dont nous avons besoin pour grandir Ă©galement pour ouvrir ces autres applications oĂą les dĂ©fis sont assez diffĂ©rents.

Comment tu fais ça?

Une erreur très frĂ©quente que je vois faire des PDG et des DSI: ils me disent quelque chose comme «HĂ©, Andrew, nous n’avons pas beaucoup de donnĂ©es – mes donnĂ©es sont en dĂ©sordre. Alors donnez-moi deux ans pour construire une excellente infrastructure informatique. Ensuite, nous aurons toutes ces excellentes donnĂ©es sur lesquelles construire l’intelligence artificielle. » Je dis toujours: «C’est une erreur. Ne fais pas ça. Premièrement, je ne pense pas qu’aucune entreprise sur la planète aujourd’hui – peut-ĂŞtre mĂŞme pas les gĂ©ants de la technologie – pense que ses donnĂ©es sont parfaitement propres et parfaites. C’est un voyage. Passer deux ou trois ans pour construire une belle infrastructure de donnĂ©es signifie que vous manquez de commentaires de la part de l’Ă©quipe d’IA pour vous aider Ă  prioriser l’infrastructure informatique Ă  construire.

Par exemple, si vous avez beaucoup d’utilisateurs, devriez-vous prioriser leur poser des questions dans une enquĂŞte pour obtenir un peu plus de donnĂ©es? Ou dans une usine, devriez-vous donner la prioritĂ© Ă  la mise Ă  niveau du capteur de quelque chose qui enregistre les vibrations 10 fois par seconde Ă  peut-ĂŞtre 100 fois par seconde? Il commence souvent Ă  faire un projet d’IA avec les donnĂ©es que vous avez dĂ©jĂ  qui permettent Ă  une Ă©quipe d’IA de vous donner les commentaires nĂ©cessaires pour vous aider Ă  hiĂ©rarchiser les donnĂ©es supplĂ©mentaires Ă  collecter.

Dans les industries oĂą nous n’avons tout simplement pas l’Ă©chelle de l’internet logiciel grand public, je pense que nous devons changer d’Ă©tat d’esprit gros donnĂ©es Ă  bon Les donnĂ©es. Si vous avez un million d’images, allez-y, utilisez-les – c’est gĂ©nial. Mais il y a beaucoup de problèmes qui peuvent utiliser des ensembles de donnĂ©es beaucoup plus petits qui sont proprement Ă©tiquetĂ©s et soigneusement organisĂ©s.

Pouvez-vous donner un exemple? Qu’entendez-vous par de bonnes donnĂ©es?

Permettez-moi d’abord de donner un exemple de la reconnaissance vocale. Lorsque je travaillais avec la recherche vocale, vous obteniez des extraits audio dans lesquels vous entendiez quelqu’un dire: «Hum, la mĂ©tĂ©o d’aujourd’hui». La question est, quelle est la bonne transcription pour ce clip audio? Est-ce «Um (virgule) le temps d’aujourd’hui», ou est-ce «Um (point, point, point) le temps d’aujourd’hui», ou est-ce que «Um» est quelque chose que nous ne transcrivons tout simplement pas? Il s’avère que n’importe lequel de ces Ă©lĂ©ments est correct, mais ce qui ne l’est pas, c’est que diffĂ©rents transcripteurs utilisent chacune des trois conventions d’Ă©tiquetage. Ensuite, vos donnĂ©es sont bruyantes et cela nuit au système de reconnaissance vocale. DĂ©sormais, lorsque vous avez des millions ou un milliard d’utilisateurs, vous pouvez avoir ces donnĂ©es bruyantes et faire la moyenne – l’algorithme d’apprentissage fonctionnera bien. Mais si vous vous trouvez dans un environnement oĂą vous disposez d’un ensemble de donnĂ©es plus petit (une centaine d’exemples, par exemple), ce type de donnĂ©es bruyantes a un impact considĂ©rable sur les performances.

Autre exemple de la fabrication: nous avons beaucoup travaillĂ© sur l’inspection de l’acier. Si vous conduisez une voiture, le cĂ´tĂ© de votre voiture Ă©tait autrefois fait d’une tĂ´le d’acier. Parfois, il y a de petites rides dans l’acier, ou de petites bosses ou des taches dessus. Vous pouvez donc utiliser une camĂ©ra et une vision par ordinateur pour voir s’il y a des dĂ©fauts ou non. Mais diffĂ©rents Ă©tiqueteurs Ă©tiqueteront les donnĂ©es diffĂ©remment. Certains mettront une boĂ®te englobante gĂ©ante dans toute la rĂ©gion. Certains mettront de petites boĂ®tes englobantes autour des petites particules. Lorsque vous disposez d’un ensemble de donnĂ©es modeste, s’assurer que les diffĂ©rents inspecteurs de la qualitĂ© Ă©tiquettent les donnĂ©es de manière cohĂ©rente – cela s’avère ĂŞtre l’une des choses les plus importantes.

Pour de nombreux projets d’IA, le modèle open source que vous tĂ©lĂ©chargez depuis GitHub – le rĂ©seau neuronal que vous pouvez obtenir dans la littĂ©rature – est assez bon. Pas pour tous les problèmes, mais pour les principaux problèmes. Je suis donc allĂ© voir beaucoup de mes Ă©quipes et j’ai dit: «HĂ©, tout le monde, le rĂ©seau neuronal est assez bon. Ne gâchons plus le code. La seule chose que vous allez faire maintenant est de crĂ©er des processus pour amĂ©liorer la qualitĂ© des donnĂ©es. » Et il s’avère que cela se traduit souvent par des amĂ©liorations plus rapides des performances de l’algorithme.

Ă€ quelle taille de donnĂ©es pensez-vous lorsque vous parlez d’ensembles de donnĂ©es plus petits? Parlez-vous d’une centaine d’exemples? Dix exemples?

L’apprentissage automatique est si diversifiĂ© qu’il est devenu très difficile de donner des rĂ©ponses universelles. J’ai travaillĂ© sur des problèmes oĂą j’avais environ 200 Ă  300 millions d’images. J’ai Ă©galement travaillĂ© sur des problèmes oĂą j’avais 10 images, et tout le reste. Quand je regarde les applications de fabrication, je pense que quelque chose comme des dizaines ou peut-ĂŞtre une centaine d’images pour une classe de dĂ©fauts n’est pas inhabituel, mais il y a une très grande variance mĂŞme au sein de l’usine.

Je trouve que les pratiques d’IA changent lorsque la taille des ensembles d’entraĂ®nement passe en dessous, disons, de 10000 exemples, car c’est en quelque sorte le seuil oĂą l’ingĂ©nieur peut essentiellement regarder chaque exemple et le concevoir lui-mĂŞme, puis prendre une dĂ©cision.

RĂ©cemment, je discutais avec un très bon ingĂ©nieur dans l’une des grandes entreprises technologiques. Et j’ai demandĂ©: “HĂ©, que faites-vous si les Ă©tiquettes ne sont pas cohĂ©rentes?” Et il a dit: «Eh bien, nous avons cette Ă©quipe de plusieurs centaines de personnes Ă  l’Ă©tranger qui s’occupe de l’Ă©tiquetage. J’Ă©crirai donc les instructions d’Ă©tiquetage, je demanderai Ă  trois personnes d’Ă©tiqueter chaque image, puis je prendrai une moyenne. ” Et j’ai dit: “Oui, c’est la bonne chose Ă  faire lorsque vous avez un ensemble de donnĂ©es gĂ©ant.” Mais lorsque je travaille avec une petite Ă©quipe et que les Ă©tiquettes ne sont pas cohĂ©rentes, je traque simplement les deux personnes qui ne sont pas d’accord l’une avec l’autre, je les fais tous les deux participer Ă  un appel Zoom et je les fais parler pour essayer de trouver une solution.

Je veux attirer notre attention maintenant pour parler de vos rĂ©flexions sur l’industrie gĂ©nĂ©rale de l’IA. L’algorithme est notre bulletin d’information sur l’IA, et j’ai donnĂ© Ă  nos lecteurs l’occasion de vous poser des questions Ă  l’avance. Un lecteur demande: le dĂ©veloppement de l’IA semble avoir principalement bifurquĂ© soit vers la recherche universitaire, soit vers des programmes de grandes entreprises Ă  grande Ă©chelle et gourmands en ressources comme OpenAI et DeepMind. Cela ne laisse pas vraiment beaucoup de place aux petites startups pour y contribuer. Selon vous, quels sont les problèmes pratiques sur lesquels les petites entreprises peuvent vraiment se concentrer pour favoriser une rĂ©elle adoption commerciale de l’IA?

Je pense qu’une grande partie de l’attention des mĂ©dias a tendance Ă  ĂŞtre sur les grandes entreprises, et parfois sur les grandes institutions universitaires. Mais si vous assistez Ă  des confĂ©rences universitaires, il y a beaucoup de travail effectuĂ© par de petits groupes de recherche et des laboratoires de recherche. Et quand je parle avec diffĂ©rentes personnes dans diffĂ©rentes entreprises et industries, j’ai l’impression qu’il y a tellement d’applications commerciales qu’elles pourraient utiliser l’IA pour lutter contre. Je vais gĂ©nĂ©ralement chez les chefs d’entreprise et je leur demande: «Quels sont vos plus gros problèmes commerciaux? Quelles sont les choses qui vous inquiètent le plus? » afin que je puisse mieux comprendre les objectifs de l’entreprise et ensuite rĂ©flĂ©chir Ă  la question de savoir s’il existe ou non une solution d’IA. Et parfois il n’y en a pas, et c’est très bien.

Je vais peut-ĂŞtre mentionner quelques lacunes que je trouve intĂ©ressantes. Je pense qu’aujourd’hui, la construction de systèmes d’IA est encore très manuelle. Vous avez quelques brillants ingĂ©nieurs en apprentissage automatique et spĂ©cialistes des donnĂ©es qui font des choses dans un ordinateur, puis poussent les choses vers la production. Il y a beaucoup d’Ă©tapes manuelles dans le processus. Je suis donc enthousiasmĂ© par les opĂ©rations de ML [machine learning operations] en tant que discipline Ă©mergente pour aider Ă  rendre le processus de construction et de dĂ©ploiement de systèmes d’IA plus systĂ©matique.

En outre, si vous examinez un grand nombre de problèmes commerciaux typiques – toutes les fonctions du marketing aux talents – il y a beaucoup de place pour l’automatisation et l’amĂ©lioration de l’efficacitĂ©.

J’espère Ă©galement que la communautĂ© de l’IA pourra se pencher sur les plus grands problèmes sociaux – voir ce que nous pouvons faire pour lutter contre le changement climatique, l’itinĂ©rance ou la pauvretĂ©. En plus des problèmes commerciaux parfois très prĂ©cieux, nous devons Ă©galement travailler sur les problèmes sociaux les plus importants.

Comment procĂ©dez-vous rĂ©ellement pour identifier s’il existe une opportunitĂ© de poursuivre quelque chose avec l’apprentissage automatique pour votre entreprise?

J’essaierai d’en apprendre un peu plus sur l’entreprise moi-mĂŞme et j’essaierai d’aider les chefs d’entreprise Ă  en apprendre un peu plus sur l’IA. Ensuite, nous rĂ©flĂ©chissons gĂ©nĂ©ralement Ă  un ensemble de projets, et pour chacune des idĂ©es, je ferai Ă  la fois une diligence technique et une diligence commerciale. Nous allons examiner: Avez-vous suffisamment de donnĂ©es? Quelle est la prĂ©cision? Y a-t-il une longue traĂ®ne lorsque vous dĂ©ployez en production? Comment remplir les donnĂ©es et fermer la boucle pour un apprentissage continu? Donc – s’assurer que le problème est techniquement rĂ©alisable. Et puis la diligence commerciale: nous nous assurons que cela permettra d’atteindre le retour sur investissement que nous espĂ©rons. Après ce processus, vous avez l’habituel, comme l’estimation des ressources, les jalons, puis, espĂ©rons-le, passer Ă  l’exĂ©cution.

Une autre suggestion: il est plus important de commencer rapidement, et c’est normal de commencer petit. Ma première application commerciale significative chez Google a Ă©tĂ© la reconnaissance vocale, et non la recherche sur le Web ou la publicitĂ©. Mais en aidant l’Ă©quipe vocale de Google Ă  rendre la reconnaissance vocale plus prĂ©cise, cela a donnĂ© Ă  l’Ă©quipe Brain la crĂ©dibilitĂ© et les moyens de rechercher des partenariats de plus en plus importants. Google Maps Ă©tait donc le deuxième grand partenariat dans lequel nous avons utilisĂ© la vision par ordinateur – pour lire les numĂ©ros de maison et gĂ©olocaliser les maisons sur Google Maps. Et ce n’est qu’après ces deux premiers projets rĂ©ussis que j’ai eu une conversation plus sĂ©rieuse avec l’Ă©quipe de publicitĂ©. Je pense donc que je vois plus d’entreprises Ă©chouer en commençant trop grand que d’Ă©chouer en commençant trop petit. C’est bien de faire un petit projet pour se lancer en tant qu’organisation afin d’apprendre ce que l’on ressent en utilisant l’IA, puis de continuer Ă  crĂ©er de plus grands succès.

Quelle est une chose que notre public devrait commencer Ă  faire demain pour mettre en Ĺ“uvre l’IA dans ses entreprises?

Lancez-vous. L’IA entraĂ®ne un changement dans la dynamique de nombreuses industries. Donc, si votre entreprise ne fait pas dĂ©jĂ  des investissements assez agressifs et intelligents, c’est le bon moment.

[ad_2]

- Advertisement -spot_img

More articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -spot_img

Latest article