Python pour la data science par Stat4decision
Lieu(x)
En centre (75)
Durée
Total : 21 heures
En centre : 21 heures
Financement
Demandeur d’emploi
Salarié
Prix
Nous contacter
Cette formation vous intéresse ?
Description générale
Première partie : introduction au langage python
Pour qui ? Pour quoi faire ? Comment ?
Les consoles et le débogage en python
Le langage (la syntaxe, les structures (string, listes, dictionnaires...), les opérateurs et les fonctions)
Construction d'un outil de calcul de statistiques simples
Les classes, les objets et la création de bibliothèques
Python pour le traitement des données
Le processus de développement d'un outil en python pour la data science
L'importation des données (texte, csv, Excel, web scrapping., SQL..)
Deuxième partie : la préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
La data visualisation
Présentation des principes de la data visualisation
Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes...
Présentation de visualisation plus avancées
Utilisation de Bokeh pour des visualisations interactives
Introduction au machine learning : présentation des principes de l'apprentissage automatique
Troisième partie : préparation des données avec la bibliothèque scikit
- learn
Cas pratiques en machine learning
La prévision en marketing
L'extraction d'informations pertinentes
Les k
- means pour la compression d'images
Les k
- plus proches voisins pour la prévision de scores
Le traitement de données textuelles
La classification d'image avec le deep learning
L'automatisation et la mise en production de traitements avec python (pipeline)
Les bibliothèques pour le big data et le deep learning : pyspark et keras
Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants
Pour qui ? Pour quoi faire ? Comment ?
Les consoles et le débogage en python
Le langage (la syntaxe, les structures (string, listes, dictionnaires...), les opérateurs et les fonctions)
Construction d'un outil de calcul de statistiques simples
Les classes, les objets et la création de bibliothèques
Python pour le traitement des données
Le processus de développement d'un outil en python pour la data science
L'importation des données (texte, csv, Excel, web scrapping., SQL..)
Deuxième partie : la préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
La data visualisation
Présentation des principes de la data visualisation
Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes...
Présentation de visualisation plus avancées
Utilisation de Bokeh pour des visualisations interactives
Introduction au machine learning : présentation des principes de l'apprentissage automatique
Troisième partie : préparation des données avec la bibliothèque scikit
- learn
Cas pratiques en machine learning
La prévision en marketing
L'extraction d'informations pertinentes
Les k
- means pour la compression d'images
Les k
- plus proches voisins pour la prévision de scores
Le traitement de données textuelles
La classification d'image avec le deep learning
L'automatisation et la mise en production de traitements avec python (pipeline)
Les bibliothèques pour le big data et le deep learning : pyspark et keras
Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants
Objectifs
Maîtriser les bases de python
Être capable d'analyser des données avec python
Être capable d'automatiser le traitement de données avec python
Connaître les outils pour la data science de python
Être capable d'analyser des données avec python
Être capable d'automatiser le traitement de données avec python
Connaître les outils pour la data science de python
Centre(s)
- Paris - 12ème (75)
Secteur(s)
Formation proposée par : Stat4decision
À découvrir