Logiciel R pour la data science par Stat4decision
Lieu(x)
En centre (75)
Durée
Total : 21 heures
En centre : 21 heures
Financement
Demandeur d’emploi
Salarié
Prix
Nous contacter
Cette formation vous intéresse ?
Description générale
Première partie : le langage R et son environnement.
Définition de l'environnement.
Présentation de la notion de packages.
Présentation de RStudio.
Les possibilités de R pour la création de documents tels que des scripts, Rmarkdown, Rnotebook, etc.
Présentation des packages importants pour la manipulation de données.
Seconde partie : les structures et les fonctionnalités de base de R.
L'importation des données : .txt, .csv, .xls, .sav, etc.
Les fonctionnalités de base pour la gestion des données.
Troisième partie : utilisation avancée de la gestion des données avec R.
La grammaire de dplyr.
Quatrième partie : statistiques descriptives avec R.
Les fonctionnalités pour la description statistique des données.
La gestion des graphiques : histogrammes, box
- plot, etc.
Cinquième partie : le data mining et le machine learning avec R.
L'analyse descriptive des données multivariées et la réduction de dimensions : ACP.
Présentation et utilisation du package FactoMineR.
Apprentissage supervisé : cas pratiques avec R.
La régression logistique.
Les arbres de décisions.
Les forêts aléatoires et les GBM.
Présentation du package caret pour ajuster les hyper
- paramètres.
L'apprentissage non supervisé - cas pratiques avec R : k
- means, etc.
Sixième partie : quelques notions de programmation avec R.
Les standards de la programmation avec R.
Construire une fonction R pour automatiser des analyses.
Les structures de contrôle : if, for, while, etc.
Définition de l'environnement.
Présentation de la notion de packages.
Présentation de RStudio.
Les possibilités de R pour la création de documents tels que des scripts, Rmarkdown, Rnotebook, etc.
Présentation des packages importants pour la manipulation de données.
Seconde partie : les structures et les fonctionnalités de base de R.
L'importation des données : .txt, .csv, .xls, .sav, etc.
Les fonctionnalités de base pour la gestion des données.
Troisième partie : utilisation avancée de la gestion des données avec R.
La grammaire de dplyr.
Quatrième partie : statistiques descriptives avec R.
Les fonctionnalités pour la description statistique des données.
La gestion des graphiques : histogrammes, box
- plot, etc.
Cinquième partie : le data mining et le machine learning avec R.
L'analyse descriptive des données multivariées et la réduction de dimensions : ACP.
Présentation et utilisation du package FactoMineR.
Apprentissage supervisé : cas pratiques avec R.
La régression logistique.
Les arbres de décisions.
Les forêts aléatoires et les GBM.
Présentation du package caret pour ajuster les hyper
- paramètres.
L'apprentissage non supervisé - cas pratiques avec R : k
- means, etc.
Sixième partie : quelques notions de programmation avec R.
Les standards de la programmation avec R.
Construire une fonction R pour automatiser des analyses.
Les structures de contrôle : if, for, while, etc.
Objectifs
Maîtrise de l'environnement de travail de R avec Rstudio.
Manipuler et gérer des données avec R et les packages de data manipulation les plus récents tels dplyr, data.table, etc.
Maîtriser l'application de méthodes de data science.
Connaitre les bases de la programmation avec R.
Manipuler et gérer des données avec R et les packages de data manipulation les plus récents tels dplyr, data.table, etc.
Maîtriser l'application de méthodes de data science.
Connaitre les bases de la programmation avec R.
Centre(s)
- Paris - 12ème (75)
Secteur(s)
Formation proposée par : Stat4decision
À découvrir