Datascientist, le nouveau magicien de votre entreprise ?

par | Mar 25, 2021

Datascientist, data sciencesont des termes sans forcément de traduction évidente, mais dont on entend beaucoup parler ces dernières années. Dans l’imaginaire de nos dirigeants, cette nouvelle discipline est décrite comme un « must have ». Une nouveauté à absolument avoir et beaucoup d’entreprises veulent désormais mettre en place des projets de data sciences et cherchent donc à recruter un datascientist ou une équipe de datascientists. 

Malheureusement, dans beaucoup de cas, le terme « mage/magicien » utilisé ici d’un point de vue humoristique, résume réellement la connaissance de ces entreprises. Elles ont une très vague idée (parfois très fausse) de ce qu’est la data science et plus généralement le travail du datascientist. Osait qu’il utilise le « big data » et « l’IA », (des termes à la mode mais parfois flous) pour trouver de la valeur !? Serait-il l’alchimiste qui transforme la data en or ? 

La réponse est bien sû« non », et on va voir que le datascientist n’est qu’une partie d’un projet de data science.

Mais du coup qu’est-ce qu’il faut pour lancer mon projet de data science ?

Dans la réalité, lancer un projet de data science nécessite plusieurs prérequis : 

Une problématique

Recruter un datascientist, oui, mais pour quoi faire ? Avez-vous une problématique à résoudre, ou un projet qui a besoin de ses services ? Pour rappel un datascientist est une personne qualifiée. Il est souvent en possession d’un master/diplôme d’ingénieur et/ou d’un doctorat. Son recrutement doit donc être contrebalancé par l’apport de son expertise. Planifié sur des projets correctement évalués sur la valeur que ses solutions apporteront. Il ne vous viendrait pas à l’idée de recruter un commercial juste comme ça et lui demander de trouver quoi vendre pour faire vivre votre entreprise ?

Des données

Si dans les termes « data science et « datascientist » on retrouve le mot « data »., ce n’est pas un hasard ! Pour travailler sur de la donnée il faut …. de la donnée ! (merci Captain Obvious). La vraie valeur dans un projet de data science, et notamment dans un projet avec de l’intelligence artificielle, ce ne sont pas les algorithmes (qui sont développés par les GAFAM, sujets de recherche et donc de publications disponibles gratuitement sur le net), mais la donnée et l’exploitation de celle-ci. Sans donnée, votre projet est voué à l’échec, ou tout du moins à un énorme ralentissement et de nombreuses difficultés ! 

Une infrastructure

On n’y pense pas souvent, mais comme le point précédent le laisse entendre, il va falloir mettre en place de quoi récolter, stocker et traiter les données utiles à votre projet (souvent importantes aussi bien en nombre qu’en valeur). De plus il va également souvent falloir, dans le cadre d’un projet IA, une puissance de calcul suffisante pour entraîner les différents modèles. Pour cette partie, vous pouvez externaliser (partiellement ou entièrement) l’infrastructure. Cette partie nécessitera les compétences d’un data ingénieur orienté devOps

La partie métier (l’humain)

La plupart des projets de data science sont déclinés en solutions spécifiques à un domaine métier. Ils sont destinés à apporter une information éclairante à un utilisateur ou à lui simplifier une tâche. L’étude et la compréhension de la problématique du client et de son environnement sont primordiales pour la bonne réussite du projet, notamment pendant la phase d’analyse de la donnée. Pour cela le datascientist a besoin de l’aide d’experts métier ou du moins, de personnes capables de l’accompagner pour collecter cette expertise (par exemple : au sein d’une équipe Agile incluant un UX Designer). 

Une équipe développement Agile

Une fois encore, la plupart des projets de data science vont s’intégrer dans un projet plus global ou du moins s’articuler autour d’une application. Et il faut pour cela une équipe composée de développeurs front et back office. Ils s’occupent de mettre en place, par exemple, les pipelines de récolte et traitement de données, le développement des tableaux de bords et autres outils de visualisation des résultats. Les testeurs qui s’assurent de la couverture des tests fonctionnels et remontent les potentiels problèmes rencontrés. Ils participent à la mesure des erreurs et aux phases d’entrainement de modèles.

« Et le datascientist dans tout ça  ? Quelles sont ces missions ? »

Elles sont résumées dans ce schéma qui décrit les étapes d’un projet de data science.

missions du datascientist

Les 5 étapes ne sont pas forcément linéaires. Il est tout à fait possible de revenir à une étape antérieure, par exemple pour améliorer la solution, ou tester une autre technologie. On peut créer un nouveau modèle, changer le jeu de données en le modifiant ou en l’enrichissant de nouvelles données, etc…

En résumé

Comme nous l’avons vu au travers de cet article, lancer un projet de data science, ne consiste pas juste à recruter un datascientist et le laisser au fond d’un bureau., accompagné d’une machine à café et d’un sandwich triangle par jour (on sait tous que ce sort est réservé uniquement aux stagiaires), et attendre qu’il vous fasse gagner beaucoup d’argent en trouvant une solution à un problème que vous n’avez pas encore !

Cela nécessite une équipe avec de nombreuses compétences différentes, une infrastructure et une préparation en amont (notamment pour la récolte de données). C’est un investissement à prendre au sérieux. Il  doit découler d’un besoin ( on ne fait pas de la data science juste pour dire « on en fait » ). J’espère que cet article vous a été utile et que vous y voyez un peu plus clair sur l’univers obscure de la data science 😉.

Vous souhaitez en savoir plus sur le rôle de datascientist ? Vous avez une problématique à laquelle la datascience peut répondre ? Nos équipes restent également à votre écoute, n’hésitez pas à nous contacter dès aujourd’hui.

 

Article proposé par

Jérémy Renaud
Data Scientist