Si vous avez déjà travaillé sur un projet perso de Data Science, vous avez probablement passé beaucoup de temps à naviguer sur Internet à la recherche de datasets intéressants à analyser.
Il peut être amusant de passer au crible des dizaines d’ensemble de données pour trouver celui qui est parfait, mais il peut aussi être frustrant de télécharger et d’importer plusieurs fichiers csv, pour se rendre compte que les données ne sont finalement pas si intéressantes.

Lire la suite »

Meilleurs datasets pour nos projets de Data Science

De la voiture autonome à la reconnaissance faciale sur Facebook, la Data Science a attiré la lumière sur elle. Ainsi les Data Scientists sont devenus extrêmement recherchés, et ce pour une bonne raison – un Data Scientist qualifié peut ajouter une valeur incroyable à une entreprise.

Mais un data scientist n’est rien sans les données auxquelles il a accès. La plupart des entreprises stockent leurs données dans divers formats: dans des bases de données et dans des fichiers texte.

Lire la suite »

Qu’est ce qu’un Data Engineer ?

Python est un langage scientifique très mature. On y trouve des librairies pour tout un tas d’utilisation différentes: notamment le Machine Learning et l’analyse de data. La visualisation de données est une partie importante pour explorer nos données et pour communiquer les résultats. 

Au cours des dernières années, de nombreuses nouvelles librairies de visualisation de données ont vu le jour sur Python pour combler son retard avec le langage R.

Lire la suite »

Visualisation de données en Python: comparaison d’outils

A la question: “Qu’est ce qui définit un excellent Data Scientist“?
Les réponses sont souvent à base de liste de compétences et d’outils, mais on ne parle jamais des personnalités qui font de grands ou d’excellents Data Scientists. J’aimerai bien aborder ce sujet dans cet article.

N’importe qui peut maîtriser les outils et les compétences pour être un Data Scientist. Mais acquérir ces outils et les appliquer correctement nécessite un ensemble de traits de caractère difficiles à identifier et encore plus difficiles à maîtriser.

Lire la suite »

Les 5 traits de caractère d’un Data Scientist

Quel est le meilleur langage pour l’analyse de données? (Python vs R)

Dans cet article, je vais comparer Python vs R de façon objective. Pour ce faire, j’analyserai des données avec ces 2 langages pour obtenir les mêmes résultats. Cela nous permettra de comprendre les forces et faiblesses de chacun. Chez Mon Coach Data, j’enseigne pour le moment seulement Python (pour avoir un cursus complet). Mais je pense que Python et R ont tous les 2 leur place dans les compétences d’un data scientist.

Lire la suite »

Python vs R : le duel

Le meilleur chemin vers la Data Science - se former à la data science

La période actuelle est passionnante pour la Data Science. De manière générale le domaine de la data a une croissante exponentielle. Les sociétés se retrouvent assises sur des mines d’or, mais n’exploitent pas encore toutes les données qu’elles possèdent. De ce fait, elles commencent à s’y intéresser et la demande pour les data scientists va dans le même sens – elle est énorme et va continuer à croître. Les salaires d’embauche sont très intéressants (aux USA et bientôt en Europe).

Lire la suite »

Comment (vraiment) se former à la Data Science

De nos jours, tout le monde souhaite se former aux métiers de la Data Science ou analyser des données. De ce fait, on me pose assez régulièrement les questions suivantes :

– Qu’est-ce que je peux faire pour me former à la Data Science?
– Comment est-ce que je peux commencer à analyser des données?
– Par quoi commencer pour apprendre le Machine Learning et écrire ses propres algorithmes ?

Méthode d'apprentissage de la Data Science

C’est jamais facile d’y répondre au vu du nombre croissant de contenu que l’on trouve maintenant sur internet.

Lire la suite »

Apprendre la Data Science : la méthode