L’algorithme des k plus proches voisins ou k-nearest neighbors (kNN) est un algorithme d’apprentissage automatique (Machine Learning) supervisé simple et facile à mettre en œuvre qui peut être utilisé pour résoudre les problèmes de classification et de régression.

Euh…wait a minute ?!? ***Pause***

Décomposons tous ces termes un par un
Machine Learning supervisé

Un algorithme de Machine Learning supervisé (par opposition à un algorithme de Machine Learning non supervisé) est un algorithme qui repose sur des données d’entrée étiquetées .

Lire la suite »

Le Data Cleaning (nettoyage de données) est l’étape la plus importante avant d’analyser ou modéliser des données mais elle peut-être très fastidieuse.

Plaçons-nous dans le contexte, c’est le début d’un nouveau projet et vous êtes impatient d’appliquer certains modèles de Machine Learning. Vous examinez les données et vous réalisez rapidement que c’est la cata: les données ne sont absolument pas exploitables en l’état.
Pour être tout à fait honnête, vous pouvez régulièrement vous attendre à consacrer jusqu’à 80% de votre temps à nettoyer les données.

Lire la suite »

Dans un précédent tutoriel, nous avons abordé les bases des boucles Python, en expliquant comment parcourir des listes et des listes de listes (ou listes imbriquées). Mais on peut faire bien plus avec des boucles for que parcourir des listes. Dans le monde réel, vous pouvez utiliser des boucles avec d’autres structures de données, par exemple des tableaux numpy ou même des DataFrames pandas. Je vous présente dans cet article quelques techniques avancées des boucles FOR en Python.

Lire la suite »

Les fonctions de Python (que ce soit les fonctions intégrées built-in ou les fonctions personnalisées que nous écrivons nous-mêmes) sont des outils essentiels pour travailler avec des données. Mais ce qu’ils font avec nos données peut être un peu déroutant surtout si on ignore ce qu’il se passe à l’intérieur. Cela pourrait entraîner de graves erreurs dans notre analyse notamment avec la distinction de données mutables et immuables en Python.

Dans cet article,

Lire la suite »

Lorsque vous travaillez avec des données, les boucles for Python peuvent être un outil puissant. Mais elles peuvent aussi être un peu déroutantes lorsque vous débutez. C’est la raison pour laquelle je vous propose un tutoriel complet sur les boucles FOR Python.
Dans cet article, nous allons nous plonger dans les boucles for et apprendre comment elles peuvent être utilisées pour faire toutes sortes de choses intéressantes notamment lorsque vous effectuez un nettoyage ou une analyse de données en Python.

Lire la suite »

Dans cet article, je vous propose 10 outils de manipulation et traitement d’images en Python: présentation de certaines des bibliothèques Python les plus utilisées, offrant un moyen simple et intuitif de manipuler et transformer des images.

Introduction

Notre monde d’aujourd’hui regorge de données et les images en constituent une partie importante. Cependant, pour pouvoir être utilisées, ces images doivent être traitées. Le traitement d’images consiste donc à analyser et à manipuler une image numérique principalement dans le but d’en améliorer la qualité ou d’en extraire des informations qui pourraient ensuite être utilisées.

Lire la suite »

En apprenant la programmation avec le langage Python, vous vous rendrez surement compte du nombre croissant de techniques d’analyse et d’utilisation de données. Le Machine Learning (ou Apprentissage Automatique) est sans doute l’un des domaines que vous souhaitez maîtriser (puisque vous êtes sur cette page).
Le Machine Learning vous permet de faire des prédictions en introduisant des données dans des algorithmes complexes. Les utilisations du Machine Learning sont infinies, ce qui en fait une compétence majeure à ajouter à votre CV.

Lire la suite »

Cet article vise à donner un aperçu des réseaux de neurones: j’y décris notamment les concepts fondamentaux.
Je tente de répondre avec vous aux questions suivantes:

  • Qu’est ce qu’un réseau de neurones?
  • Quelles sont les principales composantes des réseaux de neurones?
  • Comment fonctionnent les réseaux de neurones?
  • Qu’est-ce qu’une fonction d’activation?
  • Qu’est-ce que la rétro-propagation?
  • Quels sont les différents types de réseaux de neurones?

Lire la suite »

Cet article décrit toutes les fonctionnalités majeurs offertes par la bibliothèque Pandas. J’y démontre à quel point cet outil peut vous faire économiser du temps et de nombreux efforts lors de vos projets Data Science.

J’ai divisé cet article en trois sections. Bonne lecture 🙂

Si vous souhaitez tout connaître de la bibliothèque Pandas appliquée à la Data Science, suivez cette formation ici.

 

Section 1: Introduction à la bibliothèque Pandas

Cette section vous présente la bibliothèque Pandas et met également en évidence les 2 structures de données les plus importantes de la bibliothèque.

Lire la suite »

Dans cet article, nous examinerons certaines des bibliothèques Python pour des tâches de Data Science autres que celles couramment utilisées, telles que les pandas, scikit-learn et matplotlib. Bien que des bibliothèques telles que pandas et scikit-learn soient celles qui viennent à l’esprit pour les tâches Machine Learning, il est toujours bon de se renseigner sur les autres offres Python dans ce domaine.

Python est un langage incroyable. En fait, c’est l’un des langages de programmation qui a la croissance la plus rapide au monde.

Lire la suite »