Data Scientist : quand la donnée devient un produit
Comprendre le rôle du Data Scientist, ce qui le différencie du Data Analyst, et quand il devient pertinent d'en recruter un dans votre équipe.
Après avoir compris le rôle du Data Analyst qui analyse vos données pour éclairer vos décisions, intéressons-nous au Data Scientist. Si le Data Analyst vous dit ce qui se passe dans votre produit, le Data Scientist utilise vos données pour créer de nouvelles fonctionnalités. C'est un profil qui transforme la donnée en produit.
- Data Analyst : le premier allié de votre équipe produit
- Data Scientist : quand la donnée devient un produit (cet article)
- Data Engineer : celui qui rend la donnée accessible
Le cœur du métier
Le Data Scientist utilise les données à sa disposition pour créer des modèles de machine learning qui répondent à des besoins métiers concrets de l'entreprise. Classification de documents, détection de fraudes, systèmes de recommandation, prédiction de comportements : ce sont des problèmes que les approches classiques de développement ne peuvent pas résoudre efficacement, et qui nécessitent de laisser un algorithme apprendre à partir des données.
Un point important : le Data Scientist ne crée que très rarement de nouveaux algorithmes. Il utilise ceux qui sont publiquement disponibles en étant capable de les comprendre suffisamment pour choisir celui ou ceux qui répondent le mieux à son besoin. Sa vraie valeur n'est pas dans l'invention d'algorithmes mais dans sa capacité à formuler un problème business en termes mathématiques, à sélectionner et configurer le bon modèle, puis à évaluer si les résultats sont suffisamment fiables pour être mis en production.
Un impact business qui peut être considérable
Quand un Data Scientist travaille sur le bon problème, l'impact sur le business peut être spectaculaire. Chez Wizbii, nous avons recruté assez rapidement deux Data Scientists pour travailler sur des problématiques de classification de documents, principalement des offres d'emploi. Pouvoir classifier automatiquement des milliers d'offres dans les bonnes catégories, avec le bon niveau de qualification, dans la bonne zone géographique, c'est ce qui permettait de proposer aux utilisateurs des résultats pertinents sans intervention humaine.
Chez un précédent client, il y a une quinzaine d'années, j'ai vu des Data Scientists changer complètement la trajectoire SEO d'une entreprise en réussissant à classifier correctement des pages de forum pour créer des liens entre ces documents. Le trafic organique avait été transformé par cette capacité à structurer automatiquement un contenu qui était auparavant en vrac.
Un profil à géométrie variable
Selon son degré d'expérience, le Data Scientist peut intervenir à différents niveaux du processus. Un profil junior se concentrera principalement sur la création et l'entraînement des modèles : on lui donne des données propres et un problème à résoudre, et il travaille sur la solution. Un profil senior sera capable de participer également à la collecte de nouvelles données en amont, en identifiant quelles données supplémentaires permettraient d'améliorer les modèles, et à l'industrialisation en aval, en travaillant avec les équipes techniques pour que le modèle fonctionne en production à grande échelle.
Cette industrialisation est d'ailleurs souvent le point de friction. Un modèle qui fonctionne parfaitement dans un notebook Jupyter n'est pas forcément prêt pour la production. Le passage du prototype au système industrialisé nécessite des compétences qui sont à la frontière entre le Data Scientist et le Data Engineer, et c'est souvent là que la collaboration entre les deux profils devient indispensable.
Quand recruter un Data Scientist ?
C'est une décision qui doit dépendre vraiment des impératifs business et de l'intérêt concret pour l'entreprise de disposer de ce profil assez rare. Contrairement au Data Analyst qui a presque toujours de la valeur dès qu'il y a un produit et des utilisateurs, le Data Scientist ne se justifie que si vous avez un problème concret que le machine learning peut résoudre.
Si vous n'avez pas de problème de classification, de recommandation, de détection de patterns ou de prédiction, un Data Scientist va tourner en rond. Pire, il risque de créer des solutions en cherchant des problèmes, ce qui est la recette pour dépenser beaucoup de temps et d'argent sans résultat tangible.
Les erreurs classiques
La première erreur, et de loin la plus courante, est de vouloir embaucher un Data Scientist rapidement sans en avoir réellement le besoin. Le terme "Data Science" fait rêver, et beaucoup de fondateurs pensent qu'avoir un Data Scientist va magiquement révéler des opportunités cachées dans leurs données. Dans certains cas, c'est vrai. Dans beaucoup d'autres, l'entreprise n'a tout simplement pas assez de données ni de cas d'usage concrets pour justifier ce recrutement.
La deuxième erreur est de recruter un Data Analyst ou un expert métier en tant que Data Scientist. Les compétences ne sont pas les mêmes : le Data Analyst est un expert de l'analyse et de la visualisation, le Data Scientist est un expert en modélisation statistique et en machine learning. Dans certains cas, cette confusion va à peu près fonctionner. Dans d'autres, ce sera complètement contre-productif : l'entreprise va y laisser beaucoup d'argent, perdre du temps, et risque de se dire que le profil Data Scientist n'est pas pour elle, alors qu'en réalité elle n'a pas réalisé la bonne embauche.
Attention aussi : ce sont des métiers très techniques avec des collaborateurs qu'il faut arriver à manager et à motiver. Sans une compétence technique suffisante dans l'encadrement, cela peut s'avérer compliqué. Se faire accompagner pour structurer cette intégration peut être une bonne option.
L'impact de l'IA sur le métier
Plus que les LLM, c'est la mise à disposition de dizaines d'algorithmes en open source qui a transformé le métier ces dernières années. Le Data Scientist est passé progressivement d'un rôle de créateur d'algorithmes à un rôle d'intégrateur. Il ne construit plus ses propres modèles mathématiques de zéro : il sélectionne, configure et combine des briques existantes pour résoudre le problème qui lui est posé.
Cette évolution rend le métier plus accessible d'un certain point de vue, puisqu'il faut moins de bagage mathématique pur pour être efficace. Mais elle renforce en parallèle l'importance de la compréhension business : savoir quel algorithme utiliser pour quel problème, comment évaluer la qualité des résultats, et surtout comment traduire un besoin métier en un problème modélisable. Le Data Scientist de demain sera peut-être moins mathématicien mais certainement plus proche du business.
En résumé
Le Data Scientist transforme vos données en fonctionnalités produit grâce au machine learning. C'est un profil à fort impact mais qui ne se justifie que si vous avez un problème concret à résoudre. Ne recrutez pas un Data Scientist par effet de mode : assurez-vous d'abord d'avoir un vrai besoin business, des données en quantité suffisante, et la capacité à manager un profil technique exigeant. Et surtout, ne confondez pas Data Analyst et Data Scientist : les deux profils ont des compétences et des missions très différentes.
En création d'équipe technique, je vous aide à déterminer si votre entreprise a besoin d'un Data Analyst, d'un Data Scientist, ou des deux, et à structurer les bons recrutements au bon moment.