La Data Science n’est pas un art. C’est une science. Celle de faire parler la donnée. Elle consiste à donner du sens aux informations en votre possession et les utiliser efficacement pour faire avancer votre Business. Au cœur de cette science, on trouve des hommes et des femmes : les Data Scientists.
Le Data Scientist : décryptage en 5 points
Data Scientist : explications
Certains instituts, comme Glassdoor, n’hésitent pas à le qualifier de « meilleur job de l’année ». Les universités et écoles lancent des programmes de formation à tour de bras à travers le monde. Et entreprises et spécialistes de l’emploi l’affirment en cœur : il y a une sérieuse pénurie sur le marché. Ce profil si recherché n’est autre que celui de Data Scientist.
Parfois perçu par les directions comme l’alchimiste des temps modernes, celui qui transforme l’amas de données en or (ou en monnaie sonnante et trébuchante), il est le nouveau héros d’un univers qui ne jure que par le Big Data.
Le Data Scientist, bien plus qu’un Data Analyst
C’est un découvreur, un Christophe Colomb de la donnée en somme. Sa science s’étend au-delà des mathématiques pures, sa compréhension du Business est transversale et son intuition est son moteur. C’est le navigateur sur l’océan des données, celui qui sent les courants et devine les chemins à emprunter. Il est à la fois informaticien, statisticien, hacker, communiquant et entrepreneur…
TOP 5 des qualités clés qui forgent un vrai Data Scientist.
1 – Une dévorante curiosité
La Data Science doit, comme toute science, être animée par l’esprit de découverte. Un Data Scientist, par définition, passe son temps à imaginer de nouvelles façons de résoudre des problèmes, de nouvelles façons d’assembler les données pour découvrir des opportunités métiers, résoudre des défis et améliorer le Business de l’entreprise.
Il doit donc, sans cesse, trouver de nouvelles façons de corréler les données, trouver de nouvelles sources d’information, trouver de nouvelles façons d’analyser. Il n’y a pas de découverte sans esprit de curiosité.
La curiosité s’exprime aussi par une certaine soif d’apprendre, une qualité essentielle dans un univers Big Data encore naissant où les technologies et les outils ne cessent de se multiplier et où de nouvelles pistes à explorer naissent quotidiennement.
2 – Une bonne compréhension des Business
Le Data Scientist n’est pas un animal tapi dans son coin qui jongle avec les données pour le simple plaisir de jouer avec les données et satisfaire sa propre curiosité.
Pour répondre aux défis de l’entreprise et pour faire parler les données dans un sens qui s’aligne avec les besoins de l’entreprise, il doit avoir une vision transversale des métiers de l’entreprise et entretenir des liens étroits avec les métiers dont il manipule les données.
Le rôle d’un Data Scientist n’est pas d’appliquer des modèles statistiques dans le seul but de générer d’autres modèles. Son rôle est de comprendre le fonctionnement des métiers, leurs besoins et leurs défis pour ensuite développer des analyses à partir des données en sa possession, trouver des modèles et mettre le tout en perspective.
3 – L’âme d’un développeur
Le sujet fait souvent débat mais la réalité est qu’un bon Data Scientist a toujours plus ou moins l’âme d’un développeur. Il n’a pas besoin d’être un programmeur hors pair. Mais il doit être en mesure de créer ses propres outils et ses propres requêtes évoluées.
Ne nous y trompons pas, les deux tiers du temps, un Data Scientist n’analyse pas les données, il les extrait, les transforme, les intègre. Le cœur de son métier n’est pas la science, mais la donnée elle-même. Et, au quotidien, celle-ci n’est jamais présentée comme elle le devrait, n’est jamais complète et n’est jamais exploitable telle quelle.
Regardez ces entreprises du Net dont la Data est le cœur de métier (Yahoo, Facebook, Google, Amazon, eBay, LinkedIn, etc.) : leurs data scientists sont à l’origine d’Hadoop et d’une pléthore de toolkits, de SDKs et même de langages de programmation.
Un vrai Data Scientist maîtrise Visual Basic pour programmer ses propres modules de transformation sous Excel, connaît toutes les subtilités du langage SQL pour extraire les données dans le sens qui l’arrange, code en Python ou R afin d’exploiter les nombreux systèmes de Machine Learning incorporés dans des outils comme Splunk ou dans des offres SaaS comme Azure ML.
4 – Un Communiquant naturel
Un Data Scientist est payé pour faire des découvertes, certes, mais pas pour les garder pour lui. Il doit expliquer ce qu’il a appris et découvert en explorant des données, décrypter les implications de ses découvertes aux yeux des Business et les aider à définir des directions.
Il doit être capable de donner une trame narrative à ses découvertes et transformer des nombres en mots compréhensibles par tous.
Autrement dit, un bon Data Scientist doit aussi être un bon conteur d’histoires et Il doit :
- Savoir rendre la donnée visuelle et attractive, claire et parlante.
- Discuter avec les métiers et les ITs.
- Conseiller les directions IT et Métiers, démontrer les implications de ses découvertes
- Faire preuve de patience, ouverture d’esprit, force de conviction,
5 – Une intuition innée
On dit souvent que la Data Science consiste à trouver des diamants bruts au fond d’une quasi-infinie mine de terre et poussière, à dénicher une aiguille dans une botte de foin en expansion permanente. Les mathématiques, la multiplicité des outils, les connaissances métier sont indispensables mais ne suffisent pas toujours.
Pour trier le bon grain de l’ivraie, il faut souvent une bonne dose d’intuition !
A la lumière de ses qualités nécessaires, on perçoit mieux pourquoi le Data Scientist est aujourd’hui un oiseau rare. Mais, son rôle est devenu essentiel à mesure que petites et grandes entreprises fondent leurs actions sur la donnée. Dans ce monde où la donnée est souvent perçue comme un océan et où le Big Data fait office de rouleau emportant tout sur son passage, les entreprises de toutes tailles ont indubitablement besoin de personnes capables de surfer dessus.
Téléchargez cette ressource
Sécuriser votre système d’impression
Longtemps sous-estimée, la sécurisation d’un système d’impression d’entreprise doit être pleinement prise en compte afin de limiter le risque de fuite d’informations sensibles. Voici les 3 principales précautions à prendre.
Les articles les plus consultés
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
- Databricks lève 1 milliard de dollars !
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble
- L’utilisation des données pour survivre !
- 9 défis de transformation digitale !