A la question: « Qu’est ce qui définit un excellent Data Scientist« ?
Les réponses sont souvent à base de liste de compétences et d’outils, mais on ne parle jamais des personnalités qui font de grands ou d’excellents Data Scientists. J’aimerai bien aborder ce sujet dans cet article.
N’importe qui peut maîtriser les outils et les compétences pour être un Data Scientist. Mais acquérir ces outils et les appliquer correctement nécessite un ensemble de traits de caractère difficiles à identifier et encore plus difficiles à maîtriser.
Qu’est ce qu’un trait de caractère ?
Un trait de caractère est une habitude mentale qu’on peut appliquer dans la vie de tous les jours. Nous pouvons les développer au fil du temps et compléter ceux qui nous manquent. Rien n’est figé, aucune inquiétude!
Si on cherche à identifier les k-traits de personnalité d’un bon Data Scientist, on peut vite arriver facilement à 10/15 traits de caractère. Ce qui fait beaucoup pour une seule personne…
Si on devait s’arrêter à 5, à mon sens ce serait :
- la curiosité
- la clarté
- la créativité
- le scepticisme
- l’humilité
La curiosité
À bien des égards, la curiosité – cette faim insatiable de connaissances et de compréhension – est le premier et le plus important trait de caractère d’un Data Scientist. Notre travail consiste à poser des questions. La plupart des gens ne connaissent pas la data et ne savent pas ce qu’on peut faire ou non avec. Nous devons donc être curieux et comprendre ce que ces personnes font et ce qu’ils veulent réaliser pour répondre à leurs problématiques. Et le domaine de la Data Science évolue si rapidement que nous devons maintenir notre intérêt dans ce domaine pour rester à jour.
Pour développer la curiosité qui nous aide à construire et maintenir nos compétences, nous devons poser des questions dont nous « devrions » déjà connaître la réponse. C’est un trait stimulant à développer.
Comment le développer ? En se forçant à poser des questions élémentaires, même dans sa propre expertise (là où vous excellez) — juste par curiosité. Donc il faut apprendre à mettre son égo de côté et ne plus avoir peur de ne pas être la personne la plus intelligente de la salle.
La clarté
La clarté est une excroissance essentielle de la curiosité. Que nous écrivions du code, que nous effectuions une analyse ou que nous nettoyions des données désordonnées, nous devrions comprendre ce que nous faisons et pourquoi nous le faisons. Nous devrions être en mesure d’expliquer la Data Science comme si notre interlocuteur avait cinq ans ou au contraire détenait un doctorat.
Nous développons de la clarté en se posant constamment deux questions: « Pourquoi? » et « et alors? ».
Pour chaque étape de votre analyse, demandez-vous pourquoi vous le faites. Que signifie le résultat obtenu pour votre projet. Et dans un contexte bien plus large, quel est le sens de ce que vous faites. Et, comme un enfant curieux ou un adolescent en pleine crise, continuez à poser ces questions jusqu’à ce que vous obteniez une réponse sans faille. En d’autres termes, utilisez « Pourquoi » et « Alors quoi » pour expliquer la Data Science à quelqu’un.
Ce que l’on conçoit bien s’énonce clairement, Et les mots pour le dire arrivent aisément. (Nicolas Boileau)
La créativité
La créativité est probablement l’élément le plus controversé de cette liste, principalement parce qu’elle est mal comprise. Les gens en général la voient comme binaire: soit on l’a, soit on l’a pas. Mozart, par exemple, est censé avoir tiré sa musique de nulle part, publiant des opéras complets à l’âge de huit ans uniquement sur la base de sa créativité. L’histoire devient moins sexy quand vous apprenez que Leopold Mozart, le père de Wolfgang, était un professeur de musique qui utilisait son fils le jeune Wolfgang comme cobaye pour ses méthodes pédagogiques à la naissance du garçon.
Avec tout le respect que l’on doit à Mozart qui a certainement eu un génie musical inné, la créativité peut être apprise et développée de la même manière qu’un athlète développe les compétences pour son sport. A force d’entrainement, de volonté, de pugnacité et de résilience.
Essayez ces activités créatives régulières :
- Brainstorming sur un sujet que vous avez en tête
- jetez vos écrits sur un papier, au réveil par exemple
- Eveillez votre créativité en lisant des articles hors des sentiers battus (sur des sujets inconnus pour vous)
Essayez aussi de petits changements spontanés dans votre routine quotidienne. Vous pouvez changer votre itinéraire pour aller au travail, chercher à résoudre des problèmes de différentes manières, cela vous aidera à développer votre créativité. D’ailleurs beaucoup de gens plus intelligents que nous tous consacrent leur vie à l’étude de la créativité, il y a donc de nombreuses références pour vous aider à stimuler votre créativité (Personnellement, j’aime beaucoup la citation de Lewis Carroll qui pensaient parfois à six choses impossibles avant le petit déjeuner)
Sometimes I believe six impossible things before breakfast. (lewis Carroll)
Le sceptiscime
Même si nous voulons être toujours plus créatifs, nous devons toujours garder les pieds sur Terre (au moins un ;p). Et c’est un scepticisme sain qui nous aide à le faire. Le scepticisme freine notre créativité, nous gardant dans le monde réel plutôt que de rester constamment la tête dans les étoiles.
Mais comment développer ce scepticisme tout en gardant une curiosité optimiste qui vous pousse à continuer d’apprendre?
Gardez cette curiosité et explorez des data avec vos méthodes. Il faut considérer les hypothèses et attentes des personnes qui vous ont donné les données sans oublier de tout remettre en question. Lorsque vous construisez un modèle, examinez vos propres hypothèses. Si elles correspondent aux hypothèses du modèle et si elles correspondent réellement à ce que les données indiquent, alors on peut valider ce modèle.
Comme le disait le statisticien britannique George E. P. Box: «Tous les modèles sont faux, mais certains sont utiles». C’est en maintenant cette attitude sceptique par rapport au monde qui nous entoure et dans notre cas par rapport aux data, que nous pourrons diminuer le risque d’erreurs inhérent à la Data Science.
L’humilité
Ce qui nous amène au trait final et unificateur d’un Data Scientist: l’humilité. La Data Science n’est pas magique et nous ne sommes pas des sorciers. Un Data Scientist est conscient qu’il ne sait pas tout et qu’il est impossible de tout savoir. Il cherche toujours de nouvelles choses à apprendre et se forme perpétuellement.
D’ailleurs, être humble c’est une valeur à garder en toute occasion. Il ne faut jamais prendre quelqu’un de haut, on est tous à égalité quelque soit nos expériences et compétences. On a toujours plein de choses à apprendre de tout le monde.
Que retenir?
Les cinq traits d’un bon Data Scientist sont :
- la curiosité : Cultive ton intérieur
- la clarté : explique moi ce que tu fais comme si j’avais cinq ans ou comme si j’étais doctorant
- la créativité : Pense différemment
- le scepticisme : Tous les modèles sont faux, certains sont utiles
- l’ humilité : Tu ne vas pas sauver le monde, ne l’oublie pas
Le spécialiste des données pense «hors des sentiers battus», le ridicule ne le tue pas. Et, bien sûr, le Data Scientist est sceptique par nature. Il se méfie de ses données et ses modèles, et les évalue avec discernement et enfin il doit savoir présenter ses résultats avec clarté et humilité.
Et vous: avez-vous certains de ces traits de caractère? Comment les entretenez-vous?
Je pense qu’on peut toujours s’améliorer en faisant un travail sur soi.
Qu’est-ce que vous en pensez? Suis-je passé à côté de quelque chose d’essentiel?