Aller au contenu
Moncoachdata
  • Accueil
  • Blog
  • Tutos
  • Coaching
  • Programme Data
Connexion
Moncoachdata

Maîtriser NumPy : Le compagnon indispensable pour les Data Lovers

  • Principes de base des tableaux Numpy
  • Inspection de tableaux array de NumPy
  • Opérations sur les tableaux NumPy
  • Travailler avec des tableaux Numpy
  • NumPy pour le nettoyage de données
  • NumPy pour l’analyse statistique
  • NumPy pour l’algèbre linéaire
  • Techniques avancées pour NumPy
  • Optimisation des performances avec NumPy

Pandas : Un manuel complet pour les Data Lovers

  • Structures de données Pandas
  • Chargement et inspection des données dans Pandas
  • Sélection et indexation des données avec Pandas
  • Nettoyage de données avec Pandas
  • Manipulation de données avec Pandas
  • Agrégations de données avec Pandas
  • Visualisations de données avec Pandas
  • Traitement des données de séries temporelles avec Pandas
  • Traitement des données catégorielles avec Pandas
  • Pandas : Sujets avancés

Maîtriser Matplotlib : Un guide complet pour la visualisation de données

  • Tracé de base Matplotlib
  • Types de diagrammes Matplotlib
  • Multiples subplots Matplotlib
  • Matplotlib : Fonctionnalités avancées

Maîtriser Seaborn : Démystifier les diagrammes complexes

  • Introduction Seaborn
  • Diagrammes catégoriels avec Seaborn
  • Diagrammes univariés avec Seaborn
  • Diagrammes bivariés avec Seaborn
  • Diagrammes multivariés avec Seaborn
  • Diagrammes matriciels avec Seaborn

Maîtriser Plotly : Laisse tes visualisations parler à travers Plotly

  • Modules importants de Plotly
  • Diagrammes de base avec Plotly
  • Plotly : diagrammes avancés

Machine Learning : Explorer ses nombreuses formes

  • Comment fonctionne le Machine Learning ?
  • Apprentissage automatique supervisé
  • Apprentissage Automatique non Supervisé
  • Apprentissage semi-supervisé
  • Apprentissage par renforcement
View Categories

Apprentissage Automatique non Supervisé

Comme son nom l’indique, il s’agit de l’opposé de l’apprentissage automatique supervisé. Dans l’apprentissage supervisé, nous avons une étiquette d’entrée et de sortie, alors que dans l’apprentissage non supervisé, il y a des données d’entrée, mais elles ne sont pas explicitement étiquetées ! Ces algorithmes sont capables d’apprendre à partir des données en trouvant des modèles implicites.

Prenons l’exemple d’un algorithme qui montre différents fruits d’un panier et qui, sur la base de leur forme, de leur taille et de leur couleur, les répartit en différents groupes ; lorsque tu montres un nouveau fruit, il fait une prédiction sur le groupe.

Apprentissage Non Supervise

Les algorithmes non supervisés identifient les données sur la base de divers facteurs tels que leur densité, leurs structures, les segments similaires et d’autres caractéristiques similaires.

Quelques applications :

  1. Systèmes de recommandation
  2. Analyse du comportement des clients
  3. Regroupement d’articles d’actualité

Et bien d’autres encore…

Types d’apprentissage non supervisé #

D’une manière générale, nous pouvons les classer en 5 catégories, à savoir :

  1. Algorithmes de clustering
  2. Réduction de la dimensionnalité
  3. Détection des anomalies
  4. Apprentissage des règles d’association
  5. Autoencodeurs

Comprenons l’objectif de ces catégories et explorons les algorithmes qui en font partie.

Algorithmes de clustering #

La clustering (ou segmentation) est une technique qui consiste à regrouper dans un même groupe des ensembles d’objets similaires qui sont différents des objets de l’autre groupe sur la base de leurs similitudes. Comme dans le cas de la segmentation du panier de fruits ci-dessus.

Algorithmes dans la catégorie des clustering :

  1. K-Means
  2. DBSCAN
  3. Clustering hiérarchique
  4. Déplacement de la moyenne

Réduction de la dimensionnalité #

La réduction de la dimensionnalité revient à simplifier un problème complexe en se concentrant sur ses aspects les plus importants. Il s’agit d’une technique qui réduit le nombre de feature/caractéristiques (dimensions) d’un ensemble de données tout en conservant ses informations essentielles. Cette simplification rend l’analyse des données plus efficace et plus facile à visualiser.

Algorithmes dans la catégorie Réduction de la dimensionnalité :

  1. Analyse en composantes principales (ACP)
  2. t-Distributed Stochastic Neighbor Embedding (t-SNE) (intégration des voisins stochastiques distribués)

Détection d’anomalie #

La détection d’anomalies revient à trouver l’intrus dans un groupe. Il s’agit d’une technique utilisée dans l’analyse des données pour identifier les points de données inhabituels ou rares qui ne correspondent pas aux modèles attendus, c’est-à-dire les valeurs aberrantes. Cette technique est très utile pour détecter les anomalies dans divers domaines, de la détection des fraudes dans les transactions financières à l’identification des dysfonctionnements des équipements dans les systèmes industriels. Entraîner un modèle sur une seule classe – si quelque chose se trouve en dehors de cette classe, il peut s’agir d’une anomalie.

Algorithmes de détection d’anomalies :

  1. K-Means à une classe
  2. SVM à une classe
  3. Forêt d’isolement (Isolation Forest)

Apprentissage par règles d’association #

L’apprentissage par règles d’association permet de trouver des liens intéressants entre les articles achetés dans un magasin. Il s’agit d’une technique d’apprentissage automatique qui permet de découvrir des relations dans les données et d’identifier des modèles, des tendances et des associations entre des éléments ou des événements. L’apprentissage par règles d’association est un outil précieux pour comprendre le comportement des consommateurs, optimiser les stocks et améliorer les recommandations personnalisées.

Algorithmes dans la catégorie Apprentissage par règles d’association :

  1. Apriori
  2. FP-Growth (croissance des motifs fréquents)
  3. Algorithme Eclat

Autoencoders #

Il s’agit d’un type de réseau de neurones qui prend des données complexes, les compresse en un code, puis tente de recréer les données d’entrée à partir d’un code résumé. Ce processus de compression-décompression peut être utilisé pour supprimer le bruit des données visuelles telles que les images, les vidéos et les scanners médicaux afin d’en améliorer la qualité.

T'en as pensé quoi ?
Partager ce tuto :
  • Facebook
  • X
  • LinkedIn
Apprentissage automatique superviséApprentissage semi-supervisé
Table des matières
  • Types d'apprentissage non supervisé
    • Algorithmes de clustering
    • Réduction de la dimensionnalité
    • Détection d'anomalie
    • Apprentissage par règles d'association
    • Autoencoders

Apprentissage

  • Cours accéléré NumPy
  • Nos programmes Data
  • TOP 50 fonctions NumPy
  • MasterClass DS & ML
  • MasterClass Deep Learning
  • Mon Shot de Data Science
  • Tutoriels Data Science

Le site

  • Articles
  • Coaching
  • Communauté
  • Newsletter
  • Connexion

À propos

  • CGV
  • Contact
Payment Options
Reçois chaque semaine mes meilleures pratiques en Data Science :

© 2025 MonCoachData - Data Science & Machine Learning

YouTube Discord GitHub Linkedin RSS
Défiler vers le haut
  • Accueil
  • Blog
  • Tutos
  • Coaching
  • Programme Data
Connexion
Discord DiscordYouTube YouTube
Rechercher