Dataiku DSS par Stat4decision
Lieu(x)
En centre (75)
Durée
Total : 14 heures
En centre : 14 heures
Financement
Demandeur d’emploi
Salarié
Prix
Nous contacter
Cette formation vous intéresse ?
Description générale
Première partie : Introduction à Data Science Studio (DSS) :
Qu'est
- ce que DSS ?
Comment installer DSS ?
Quels usages et quels utilisateurs ?
DSS dans le paysage des plateformes data science.
Quelles solutions possibles pour DSS ? Mode de licensing et d'utilisation.
Deuxième partie : L'interface DSS :
Découverte de l'interface.
La notion de projet.
La notion de flux.
Travailler dans le Lab.
Comment travailler en équipe avec DataIku : le partage, le versionnement.
Troisième partie : La manipulation des données avec DSS :
Principe de la préparation des données.
Importer des données de différents types (csv, xls, sql...).
Appliquer des recettes pour transformer des données (Transformation de données; Gestion des types; Manipulation des données textuelles; Jointure de fichiers).
Ateliers sur des données d'open data.
Quatrième partie : La data visualisation avec DSS :
Présentation des principes de la data visualisation.
Quelques graphiques simples avec DataIku DSS.
Présentation de visualisations plus avancées.
Ateliers sur des données réelles (Manipulation de données pour afficher des séries temporelles; Affichage de cartographie avec DSS).
Le développement et le partage de tableaux de bord (Dashboard) avec DSS.
Cinquième partie : Introduction au machine learning : présentation des principes de l'apprentissage automatique.
Construction d'un premier modèle avec Dataiku (Le machine learning supervisé; Le machine learning non supervisé).
Les autres modèles disponibles dans DSS.
Atelier sur des données (Préparation et construction de modèles; Ajustement des hyper
- paramètres).
Sixième partie : La mise en production d'un projet DSS :
Les bundles.
Les automation node et les API node.
Les scénarios.
Le monitoring.
Septième partie : Aller plus loin :
L'intégration de code en Python ou en R dans DataIku DSS (les Notebooks) : Utilisation de Notebook et de recettes sous forme de code.
L'utilisation d'infrastructures Big Data (Hadoop / Spark) : Le choix du moteur de calcul.
Le deep learning dans DSS.
Qu'est
- ce que DSS ?
Comment installer DSS ?
Quels usages et quels utilisateurs ?
DSS dans le paysage des plateformes data science.
Quelles solutions possibles pour DSS ? Mode de licensing et d'utilisation.
Deuxième partie : L'interface DSS :
Découverte de l'interface.
La notion de projet.
La notion de flux.
Travailler dans le Lab.
Comment travailler en équipe avec DataIku : le partage, le versionnement.
Troisième partie : La manipulation des données avec DSS :
Principe de la préparation des données.
Importer des données de différents types (csv, xls, sql...).
Appliquer des recettes pour transformer des données (Transformation de données; Gestion des types; Manipulation des données textuelles; Jointure de fichiers).
Ateliers sur des données d'open data.
Quatrième partie : La data visualisation avec DSS :
Présentation des principes de la data visualisation.
Quelques graphiques simples avec DataIku DSS.
Présentation de visualisations plus avancées.
Ateliers sur des données réelles (Manipulation de données pour afficher des séries temporelles; Affichage de cartographie avec DSS).
Le développement et le partage de tableaux de bord (Dashboard) avec DSS.
Cinquième partie : Introduction au machine learning : présentation des principes de l'apprentissage automatique.
Construction d'un premier modèle avec Dataiku (Le machine learning supervisé; Le machine learning non supervisé).
Les autres modèles disponibles dans DSS.
Atelier sur des données (Préparation et construction de modèles; Ajustement des hyper
- paramètres).
Sixième partie : La mise en production d'un projet DSS :
Les bundles.
Les automation node et les API node.
Les scénarios.
Le monitoring.
Septième partie : Aller plus loin :
L'intégration de code en Python ou en R dans DataIku DSS (les Notebooks) : Utilisation de Notebook et de recettes sous forme de code.
L'utilisation d'infrastructures Big Data (Hadoop / Spark) : Le choix du moteur de calcul.
Le deep learning dans DSS.
Objectifs
Découverte de l'interface de DSS et de son utilisation.
Compréhension des installations et des systèmes de licensing.
Construction de projets et de flux de manipulation de données.
Mise en place de premiers modèles de machine learning.
Compréhension de la mise en production des modèles et des flux.
Compréhension des installations et des systèmes de licensing.
Construction de projets et de flux de manipulation de données.
Mise en place de premiers modèles de machine learning.
Compréhension de la mise en production des modèles et des flux.
Centre(s)
- Paris - 12ème (75)
Secteur(s)
Formation proposée par : Stat4decision
À découvrir