Cet article vise à donner un aperçu des réseaux de neurones: j’y décris notamment les concepts fondamentaux.
Je tente de répondre avec vous aux questions suivantes:

  • Qu’est ce qu’un réseau de neurones?
  • Quelles sont les principales composantes des réseaux de neurones?
  • Comment fonctionnent les réseaux de neurones?
  • Qu’est-ce qu’une fonction d’activation?
  • Qu’est-ce que la rétro-propagation?
  • Quels sont les différents types de réseaux de neurones?

Lire la suite »

Cet article décrit toutes les fonctionnalités majeurs offertes par la bibliothèque Pandas. J’y démontre à quel point cet outil peut vous faire économiser du temps et de nombreux efforts lors de vos projets Data Science.

J’ai divisé cet article en trois sections. Bonne lecture 🙂

Si vous souhaitez tout connaître de la bibliothèque Pandas appliquée à la Data Science, suivez cette formation ici.

 

Section 1: Introduction à la bibliothèque Pandas

Cette section vous présente la bibliothèque Pandas et met également en évidence les 2 structures de données les plus importantes de la bibliothèque.

Lire la suite »

Python est un langage incroyable. En fait, c’est l’un des langages de programmation qui a la croissance la plus rapide au monde. Il a maintes fois prouvé son utilité à la fois dans les rôles de développeur web, data scientist ou développeur logiciel. L’ensemble de l’écosystème de Python et de ses bibliothèques en fait un choix judicieux pour les utilisateurs (débutants et avancés). L’une des raisons de son succès et de sa popularité est son ensemble de bibliothèques robustes qui le rendent si dynamique et rapide.

Lire la suite »

La prédiction de la qualité d’air est un sujet délicat et important. Il est possible avec des modèles de Machine Learning de prédire avec précision cette qualité. Notons que produire une prévision de bonne qualité c’est difficile. Cela demande beaucoup d’expérience et certaines compétences très spécifiques. Certes, il existe des outils de prévision mais qui sont assez rigides, notamment pour intégrer certaines hypothèses utiles.

Pour ces raisons, Facebook a créé Prophet,

Lire la suite »

Si vous êtes Data Scientist, vous avez sans doute déjà travaillé avec des graphiques à nuage de points. Malgré leur simplicité, les graphiques à nuage de points sont des outils puissants pour visualiser des données. Il existe de nombreuses façons de les représenter en fonction des attributs tels que la couleur, la taille, la forme et le tracé de régression.

Dans cet article, je vous dis à peu près tout ce que vous devez savoir sur la visualisation de données avec des graphiques à nuage de points!

Lire la suite »

La bibliothèque NumPy est une bibliothèque Python importante pour les Data Scientists, une bonne raison de s’y familiariser. Les tableaux Numpy sont comme des listes Python, mais en beaucoup mieux! En effet, il est beaucoup plus facile de manipuler un tableau Numpy que de manipuler une liste Python. Vous pouvez utiliser un tableau Numpy au lieu d’avoir plusieurs listes Python. Les tableaux Numpy calculent également plus rapidement que les listes et sont extrêmement efficaces pour effectuer des opérations mathématiques et logiques.

Lire la suite »

Python est l’un des langages de programmation les plus populaires et les plus demandés au monde. Ceci pour plusieurs raisons:

  • C’est facile à apprendre
  • C’est super polyvalent
  • Il a une vaste gamme de modules et de bibliothèques

J’utilise quotidiennement Python dans le cadre de mon travail en tant que data scientist. De mon utilisation, j’ai relevé quelques astuces et conseils utiles que je vous dévoile et partage en ce début d’année.

Lire la suite »

Python est le langage de prédilection des spécialistes des données – et ce que pour de bonnes raisons. Il fournit à la fois l’écosystème le plus vaste pour un langage de programmation et la profondeur d’excellentes bibliothèques de calcul scientifique. Si vous ne connaissez pas encore le langage Python, regardez mon cours Python ici (ou même pour aller plus loin le cours d’analyse avec Pandas).

Parmi ses bibliothèques de calcul scientifique,

Lire la suite »

Les expressions régulières (regex ou regexp) sont extrêmement utiles pour extraire des informations d’un texte en recherchant une ou plusieurs correspondances à l’aide d’un modèle de recherche spécifique (c’est-à-dire une séquence spécifique de caractères ASCII ou Unicode).

Les domaines d’application vont de la validation à l’analyse/remplacement de chaînes de caractères, en passant par la transposition de données vers d’autres formats mais aussi le web scraping (lire l’article).

L’une des fonctionnalités les plus intéressantes c’est qu’une fois que vous avez appris la syntaxe,

Lire la suite »

Les entreprises de Data Science se tournent de plus en plus vers les portfolios pour leurs processus d’embauche. Une des raisons à cela est qu’un portfolio est le meilleur moyen de juger des compétences réelles d’une personne. La bonne nouvelle pour vous, c’est qu’un portfolio dépend uniquement de vous. Si vous travaillez suffisamment, vous pourrez constituer un excellent portfolio avec des projets hétérogènes et passionnants qui impressionnera nombre d’entreprises.

La première étape pour créer un portfolio de grande qualité consiste à savoir quelles compétences vous devez démontrer.

Lire la suite »