Dans certains sports, les entraîneurs désignent des impact players, des joueurs dont l’entrée sur le terrain en cours de match peut le faire basculer. En science aussi, il existe des acteurs « à impact ». Gaël Varoquaux, informaticien à l’Institut national de recherche en sciences et technologies du numérique (Inria), est peut-être de ceux-là. En plus, il est sportif, moniteur fédéral de voile depuis ses 18 ans, skieur de randonnée et adepte d’escalade et des longues balades à vélo.
A 43 ans, il est surtout le chercheur français le plus cité dans le domaine de l’intelligence artificielle (IA). Un article qu’il a cosigné en 2011 est mentionné plus de 62 000 fois dans d’autres travaux, selon la base de données Scopus, quand ceux de Yann Le Cun, autre vedette nationale du domaine, le sont au maximum 60 000 fois.
Pourtant, son apport n’est pas lié à l’IA générative à la ChatGPT ni même au deep learning (apprentissage profond), qui a révolutionné la reconnaissance d’images. Il s’agit de machine learning, ou apprentissage machine, dont il a contribué à faciliter l’usage en étant coauteur du logiciel le plus utilisé en la matière, Scikit-learn. Cette boîte à outils est truffée de plus de 150 méthodes statistiques pour classer des objets, les regrouper par similarité ou identifier leurs particularités automatiquement. Tout pour faire parler de grandes masses de données, en quelques lignes de code. Scikit-learn est téléchargé environ 80 millions de fois par mois, quand les outils de deep learning, PyTorch ou TensorFlow, des géants Meta et Google, le sont moins de 30 millions de fois, rappelait encore Gaël Varoquaux lors d’un exposé à la conférence dotAI, le 18 octobre, à Paris.
Il vous reste 81.2% de cet article à lire. La suite est réservée aux abonnés.