Pourquoi le choix des structures de données est «extrêmement» important?

Les structures de données sont des moyens spécifiques d’organiser et de stocker des données afin qu’elles puissent être consultées et travaillées de manière efficace. Les structures de données définissent la relation entre les données et les opérations pouvant être effectuées dessus.

Le choix d’une structure de données dépend du problème que nous résolvons et du type de données dont nous disposons.

Lire la suite »

Les structures de données Python

L’algorithme des k plus proches voisins ou k-nearest neighbors (kNN) est un algorithme d’apprentissage automatique (Machine Learning) supervisé simple et facile à mettre en œuvre qui peut être utilisé pour résoudre les problèmes de classification et de régression.

Euh…wait a minute ?!? ***Pause***

Décomposons tous ces termes un par un

Machine Learning supervisé

Un algorithme de Machine Learning supervisé (par opposition à un algorithme de Machine Learning non supervisé) est un algorithme qui repose sur des données d’entrée étiquetées .

Lire la suite »

Machine Learning : l’algorithme des k plus proches voisins

Le Data Cleaning (nettoyage de données) est l’étape la plus importante avant d’analyser ou modéliser des données mais elle peut-être très fastidieuse.

Plaçons-nous dans le contexte, c’est le début d’un nouveau projet et vous êtes impatient d’appliquer certains modèles de Machine Learning. Vous examinez les données et vous réalisez rapidement que c’est la cata: les données ne sont absolument pas exploitables en l’état.
Pour être tout à fait honnête, vous pouvez régulièrement vous attendre à consacrer jusqu’à 80% de votre temps à nettoyer les données.

Lire la suite »

Nettoyage de données avec Python : détection des valeurs manquantes

Dans un précédent tutoriel, nous avons abordé les bases des boucles Python, en expliquant comment parcourir des listes et des listes de listes (ou listes imbriquées). Mais on peut faire bien plus avec des boucles for que parcourir des listes. Dans le monde réel, vous pouvez utiliser des boucles avec d’autres structures de données, par exemple des tableaux NumPy ou même des DataFrames pandas. Je vous présente dans cet article les boucles FOR Python techniques avancées.

Lire la suite »

Les boucles FOR en Python (techniques avancées)

Les fonctions de Python (que ce soit les fonctions intégrées built-in ou les fonctions personnalisées que nous écrivons nous-mêmes) sont des outils essentiels pour travailler avec des données. Mais ce qu’ils font avec nos données peut être un peu déroutant surtout si on ignore ce qu’il se passe à l’intérieur. Cela pourrait entraîner de graves erreurs dans notre analyse notamment avec la distinction de données mutables et immuables Python.

Dans cet article,

Lire la suite »

Données mutables et immuables Python

Lorsque vous travaillez avec des données, les boucles for Python peuvent être un outil puissant. Mais elles peuvent aussi être un peu déroutantes lorsque vous débutez. C’est la raison pour laquelle je vous propose un tutoriel complet sur les boucles FOR Python.
Dans cet article, nous allons nous plonger dans les boucles for et apprendre comment elles peuvent être utilisées pour faire toutes sortes de choses intéressantes notamment lorsque vous effectuez un nettoyage ou une analyse de données en Python.

Lire la suite »

Python : les boucles FOR expliquées de A à Z

Dans cet article, je vous propose 10 outils de manipulation et traitement d’images en Python : présentation de certaines des bibliothèques Python les plus utilisées, offrant un moyen simple et intuitif de manipuler et transformer des images.

Traitement d’images en Python : Introduction

Notre monde d’aujourd’hui regorge de données et les images en constituent une partie importante. Cependant, pour pouvoir être utilisées, ces images doivent être traitées. Le traitement d’images consiste donc à analyser et à manipuler une image numérique principalement dans le but d’en améliorer la qualité ou d’en extraire des informations qui pourraient ensuite être utilisées.

Lire la suite »

10 outils de manipulation et traitement d’images en Python

En apprenant la programmation avec le langage Python, vous vous rendrez surement compte du nombre croissant de techniques d’analyse et d’utilisation de données. Le Machine Learning (ou Apprentissage Automatique) est sans doute l’un des domaines que vous souhaitez maîtriser (puisque vous êtes sur cette page).
Le Machine Learning vous permet de faire des prédictions en introduisant des données dans des algorithmes complexes. Les utilisations du Machine Learning sont infinies, ce qui en fait une compétence majeure à ajouter à votre CV.

Lire la suite »

Apprendre le Machine Learning avec Python (cas pratique)

Cet article vise à donner un aperçu des réseaux de neurones: j’y décris notamment les concepts fondamentaux.
Je tente de répondre avec vous aux questions suivantes:

  • Qu’est ce qu’un réseau de neurones?
  • Quelles sont les principales composantes des réseaux de neurones?
  • Comment fonctionnent les réseaux de neurones?
  • Qu’est-ce qu’une fonction d’activation?
  • Qu’est-ce que la rétro-propagation?
  • Quels sont les différents types de réseaux de neurones?

Lire la suite »

Comprendre les réseaux de neurones

Cet article décrit toutes les fonctionnalités majeurs offertes par la bibliothèque Pandas. J’y démontre à quel point cet outil peut vous faire économiser du temps et de nombreux efforts lors de vos projets Data Science.

J’ai divisé cet article en trois sections. Bonne lecture 🙂

Si vous souhaitez tout connaître de la bibliothèque Pandas appliquée à la Data Science, suivez cette formation ici.

Section 1: Introduction à la bibliothèque Pandas

Cette section vous présente la bibliothèque Pandas et met également en évidence les 2 structures de données les plus importantes de la bibliothèque.

Lire la suite »

Guide : la bibliothèque Pandas