Python pour la Data Science

Python Pour La Ds

Apprends Python pour l’appliquer à des sujets de Data Science et Machine Learning en 30 jours.
30 jours de cours pratiques pour te permettre d’acquérir de solides fondations sur le langage Python. Que tu sois débutant ou que tu aies besoin d’un petit rafraîchissement, tu apprendras (ou réviseras) les bases de Python pour une transition efficace vers la Data Science et le Machine Learning.

Les premières étapes de l’apprentissage du code sont les plus importantes. Il est facile d’apprendre les mauvaises choses ou d’omettre des connaissances fondamentales qui peuvent s’avérer cruciales à long terme.

Si tu souhaites apprendre Python pour faire progresser ta carrière, acquérir de nouvelles compétences ou obtenir une augmentation, ce cours est fait pour toi !
En 30 jours, tu passeras du stade “je ne sais pas écrire une seule ligne de code” à celui de “je réalise mes premiers projets de Machine Learning !”. Et si tu as déjà les bases, ce cours constitue un solide rappel des fondamentaux. De plus, tu pourras à tout moment t’y référer pour tes prochains projets !

Ce que tu vas apprendre en seulement 30 jours.

  • Introduction au langage Python
  • Analyse de données avec NumPy & Pandas
  • Visualisation de données avec Matplotlib & Seaborn
  • Machine Learning avec Scikit-Learn

Temps approximatif requis :

Entre 30 minutes et 1 heure par jour (pendant 30 jours)

Aucun prérequis pour ce cours.

Et pour discuter de tous ces sujets Python et Data Science, on t’attend sur le Discord 🙂

Contenu cours

Architecture du cours
JOURS 1-9 : INTRODUCTION À PYTHON
Objectifs d’apprentissage Python
Jour 1 : Introduction à la programmation Python
5 Chapitres
Python, c’est quoi ?
Impression en Python
Les variables Python
Nombres entiers et flottants en Python
Conclusion
Jour 2 : Fonctions Python
8 Chapitres
Qu’est-ce qu’une fonction Python ?
Création de notre première fonction Python
Fonction Python qui prend des arguments
Utilisation des paramètres par défaut dans les fonctions Python
Fonctions Python qui retournent quelque chose
Ajouter des docstrings aux fonctions Python
Conclusion
Jour 3 : Installation de Python
4 Chapitres
Comment installer Python sous Windows ?
Comment installer Python sur macOS
Suivre le cours sur des notebooks deepNote
Conclusion
Jour 4 : Conditions et Booléens
7 Chapitres
Booléens Python
Opérateurs de comparaison Python
Opérateurs logiques Python : Combinaison de booléens
Flux conditionnel Python : If-Else
Opérateurs d’identité en Python
Exercice : Conditions en Python
Conclusion & Récap
Jour 5 : Boucles FOR et Itérations
8 Chapitres
Pourquoi avons-nous besoin des boucles FOR en Python ?
Syntaxe des boucles FOR Python
Comment fonctionnent les boucles FOR ?
Extension des boucles FOR de Python avec la fonction range()
Déclarations IF dans les boucles FOR
La boucle FOR imbriquée en Python
L’instruction BREAK dans les boucles FOR Python
Conclusion & Récap
Jour 6 : Listes Python
9 Chapitres
Qu’est-ce qu’une liste Python ?
Accéder aux données dans les listes Python
Modifier les éléments d’une liste Python
Ajouter des éléments à une liste Python
Supprimer des éléments d’une liste Python
Itérer sur des listes Python
Compréhensions de listes en Python
Listes de listes Python
Conclusion & Récap
Jour 7 : Dictionnaires Python
9 Chapitres
Qu’est-ce qu’un dictionnaire ?
Créer un dictionnaire Python
Comment les dictionnaires sont-ils liés à la Data Science ?
Travailler avec des dictionnaires Python
Méthodes de dictionnaire Python
Itérer dans les dictionnaires Python
Les dictionnaires Python sont-ils ordonnés ?
Exercice
Conclusion & Récap
Jour 8 : Tuples Python
11 Chapitres
Qu’est-ce qu’un tuple ?
Différences entre les listes et les tuples Python
Pourquoi utiliser les tuples plutôt que les listes en Python ?
Comment créer un tuple en Python ?
Accéder aux éléments des tuples Python
Itérer sur des tuples en Python
Modifier des tuples en Python
Concaténer et répéter des tuples en Python
Méthodes Python pour les tuples
Exercices
Conclusion & Récap
Jour 9 : Programmation Orientée Objet (POO)
11 Chapitres
Introduction à la Programmation Orientée Objet
Pourquoi créer des objets en Python ?
Objets et classes en Python
Attributs de classe et d’instance Python
Fonctions et méthodes Python
Héritage de classe en Python
Polymorphisme dans les classes Python
Quand utiliser la Programmation Orientée Objet ?
Exercices
Conclusion & Récap
JOURS 10-23 : ANALYSE DE DONNÉES AVEC PANDAS
Objectifs Analyse de Données
Jour 10 : Travailler avec des bibliothèques externes
8 Chapitres
Qu’est-ce que des bibliothèques externes pour Python ?
Pourquoi utiliser des bibliothèques externes avec Python ?
Comment importer une bibliothèque externe avec Python ?
Comment installer des librairies externes avec Python ?
Comment utiliser les librairies externes avec Python
Encore une fois, pourquoi utiliser les bibliothèques Python ?
Exercices
Conclusion & Récap
Jour 11 : NumPy pour la Data Science
14 Chapitres
Pourquoi utiliser NumPy pour la Data Science avec Python ?
Installer et importer NumPy avec Python
Créer des Tableaux NumPy avec Python
Tableaux NumPy versus Listes Python
Indexation, découpage et indexation booléenne des tableaux NumPy
Tableaux NumPy multidimensionnels
Appliquer des fonctions sur des tableaux NumPy
Concaténer des tableaux NumPy
Générer des tableaux NumPy
Générer des nombres aléatoires avec NumPy
Création d’une distribution normale (gaussienne) avec NumPy
Création d’un tableau d’entiers aléatoires avec NumPy
Exercices
Conclusion & Récap
Jour 12 : Introduction à Pandas pour la Data Science
7 Chapitres
Qu’est-ce que Pandas ?
Comment installer Pandas dans Python ?
Qu’est-ce qu’une Series Pandas ?
Qu’est-ce qu’un DataFrame Pandas ?
Importer un DataFrame Pandas à partir d’un fichier
Exercices
Conclusion & Récap
Jour 13 : Indexation, Sélection et Affectation de données
9 Chapitres
Chargement d’un exemple de DataFrame Pandas
Les deux types d’indices de DataFrame
Accéder aux colonnes d’un DataFrame Pandas
Accéder aux lignes d’un DataFrame Pandas
Accéder aux valeurs d’un DataFrame Pandas
Sélection conditionnelle de données dans un DataFrame Pandas
Affectation de données dans Pandas
Exercices
Conclusion & Récap
Jour 14 : Compter les valeurs dans Pandas avec value_counts
10 Chapitres
Exploration de la méthode value_counts de Pandas
Chargement d’un exemple de DataFrame Pandas
Création d’un tableau de fréquence Pandas avec value_counts
Trier un tableau de fréquence Pandas
Calculer un tableau de fréquence Pandas avec des pourcentages
Mise en boîte des données dans les tables de fréquence Pandas
Exercices
Conclusion & Récap
Jour 15 : Synthèse et Analyse d’un DataFrame Pandas
8 Chapitres
Chargement d’un exemple de DataFrame Pandas
Fonctions récapitulatives Pandas
Lecture de la documentation de Pandas
Obtenir des statistiques sommaires avec describe de Pandas
Recherche de valeurs uniques dans un DataFrame Pandas
Création de tableaux croisés d’un DataFrame Pandas
Exercices
Conclusion & Récap
Jour 16 : Comment trier des données dans un DataFrame Pandas
10 Chapitres
Exploration de la méthode Pandas sort_values()
Chargement d’un exemple de DataFrame Pandas
Tri d’une seule colonne de DataFrame Pandas
Tri de plusieurs colonnes de DataFrame Pandas
Modifier l’ordre de tri dans Pandas sort_values
Tri des valeurs manquantes dans un DataFrame Pandas
Réinitialisation d’un index avec un DataFrame Pandas trié
Trier un DataFrame Pandas avec remplacement
Exercices
Conclusion & Récap
Jour 17 : Mise en boîte de données dans Pandas avec cut et qcut
7 Chapitres
Qu’est-ce que le binning en Pandas et Python ?
Chargement d’un exemple de DataFrame Pandas
Pandas qcut : Regroupement des données en Bins de taille égale
Pandas cut : Binning de données dans des Bins personnalisés
Ajouter des étiquettes aux Bins avec cut de Pandas
Exercices
Conclusion & Récap
Jour 18 : Transformation de colonnes Pandas avec map et apply
7 Chapitres
Chargement d’un exemple de DataFrame Pandas
Comprendre les fonctions vectorielles dans Pandas
Utilisation de la méthode Pandas map
Utilisation de la méthode Pandas apply
Implications des performances de map and apply de Pandas
Exercices
Conclusion & Récap
Jour 19 : Grouper et Agréger des données
13 Chapitres
Qu’est-ce que la méthode GroupBy de Pandas ?
Chargement d’un exemple de DataFrame Pandas
Comprendre les objets GroupBy de Pandas
Comprendre Split-Apply-Combine de GroupBy Pandas
Agrégation de données avec GroupBy de Pandas
Transformation des données avec GroupBy de Pandas
Filtrer des données avec GroupBy de Pandas
Regroupement d’un DataFrame Pandas par plusieurs colonnes
Utilisation de fonctions personnalisées avec GroupBy de Pandas
Exemples utiles d’utilisation de GroupBy de Pandas
Exercices
Conclusion & Récap
Jour 20 : Combinaison de données avec fusion et concat
5 Chapitres
Différentes façons de combiner des données
Concaténation de DataFrames Pandas
Fusionner des données avec merge de Pandas
Exercices
Conclusion & Récap
Jour 21 : Tableaux croisés dynamiques dans Pandas avec Python
10 Chapitres
Comment créer un tableau croisé dynamique en Python ?
Chargement d’un exemple de DataFrame Pandas
Créer un tableau croisé dynamique avec Pandas
Tableaux croisés dynamiques Pandas plus complexes
Personnalisation des tableaux croisés dynamiques Pandas
Filtrer les tableaux croisés dynamiques Python
Exercices
Conclusion & Récap
Jour 22 : Nettoyage et préparation des données
5 Chapitres
Traitement des données manquantes dans Pandas
Travailler avec des données dupliquées dans Pandas
Nettoyage des chaînes de caractères dans Pandas
Exercices
Conclusion & Récap
Jour 23 : DateTime avec Pandas et Python
6 Chapitres
Importation de DateTimes dans les DataFrames Pandas
Attributs et méthodes de DateTime dans Pandas
Filtrer un DataFrame Pandas basé sur DateTimes
Ré-échantillonnage des DataFrames de Pandas à l’aide des DateTimes
Exercices
Conclusion & Récap
JOURS 24-25 : VISUALISATION DE DONNÉES
Objectifs Visualisation de données
Jour 24 : Tracer des graphiques en Python avec Matplotlib
10 Chapitres
Qu’est-ce que Matplotlib de Python ?
Comment installer et importer Matplotlib de Python
L’anatomie d’un objet Matplotlib
Créer ton premier tracé Matplotlib : un graphique linéaire
Utilisation de Pandas avec Matplotlib de Python
Personnalisation des tracés Matplotlib de Python
Création de diagrammes circulaires avec Matplotlib de Python
Création de diagrammes à barres avec Matplotlib de Python
Exercices
Conclusion & Récap
Jour 25 : Seaborn pour la visualisation de données
9 Chapitres
Introduction à Seaborn
Diagrammes de dispersion avec Seaborn
Stylisation et personnalisation des diagrammes Seaborn
Approfondissement des diagrammes de dispersion Seaborn
Création de graphiques multiples avec Seaborn
Création de graphiques catégoriels avec Seaborn
Personnaliser les diagrammes Seaborn avec des palettes
Exercices
Conclusion & Récap
JOURS 26-30 : MACHINE LEARNING
Objectifs Machine Learning
Jour 26 : Introduction au Machine Learning avec Python
6 Chapitres
Qu’est-ce que le Machine Learning ?
Catégories de Machine Learning
Apprentissage supervisé en Python
Apprentissage non supervisé en Python
Le processus de Machine Learning
Conclusion & Récap
Jour 27 : Introduction à Scikit-Learn (sklearn) en Python
6 Chapitres
Qu’est-ce que Scikit-Learn de Python ?
Comment installer Scikit-Learn avec Python ?
Comment les données sont-elles représentées dans Scikit-Learn ?
Ton premier projet de Machine Learning : Classifier des données
Exercices
Conclusion & Récap
5 Chapitres
Comprendre la fonction train_test_split de Scikit-Learn
Fractionnement d’un échantillon de données dans Scikit-Learn
Visualisation du fractionnement Entraînement | Test
Conclusion & Récap
Jour 29 : Régression linéaire avec Scikit-Learn
8 Chapitres
Qu’est-ce qu’une régression linéaire ?
Chargement d’un échantillon de données
Explorer la corrélation à l’aide de Pandas
Tracer un diagramme par paire de nos données
Régression linéaire multivariée dans Scikit-Learn
Exercices
Conclusion & Récap
Jour 30 : Introduction aux Random Forest dans Scikit-Learn
9 Chapitres
Rappel sur les classificateurs à arbre de décision
Aperçu des classificateurs Random Forest
Chargement d’un échantillon de données
Gérer les données manquantes dans Scikit-Learn
Traiter les données catégorielles dans Scikit-Learn
Créer notre première Random Forest : Classification des pingouins
Évaluation des performances d’une Random Forest dans Scikit-Learn
Visualisation des arbres de décision Random Forest dans Scikit-Learn
Conclusion & Récap