Analyse de données en environnement Hadoop par Data Value
Lieu(x)
En centre (75)
Durée
Total : 21 heures
En centre : 21 heures
Financement
Demandeur d’emploi
Salarié
Prix
Nous contacter
Cette formation vous intéresse ?
Description générale
- 1ère partie
Comprendre Hadoop 2.0 et son écosystème
Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
Le Hadoop Distributed File System (HDFS)
Introduction aux données dans HDFS
MapReduce Framework et YARN
- 2ème partie
Introduction à Pig
Programmation Pig avancée
Troubleshooting et optimisation avec Pig
Résolution des problèmes avec Pig
Utiliser l'UI Web d'Hadoop
Démo optionnelle : résolution d'un Failed Job avec l'UI Web
Echantillonnage de données et débogage
Vue d'ensemble des performances
Comprendre le plan d'exécution
Astuces pour améliorer la performance de vos Pig Jobs
- 3ème partie
Programmation Hive
Utilisation de HCatalog
Programmation Hive avancée
Etendre Hive
Transformation de données avec des Scripts personnalisés
Fonctions définies par l'utilisateur
Paramétrer les requêtes
Exercices Hands
- On : transformation de données avec Hive
Programmation Hive avancée (suite)
Analyse de données et statistiques
- 4ème partie
Import/Export avec Sqoop (SGBDR HDFS)
Sqoop, fonctions avancées
Définition de workflow avec Oozie
- Optionnel : (sous réserve de temps)
Introduction à H
- Base
Exemple d'ingestion de données avec l'ETL Talend
Créer son propre cluster Hadoop (plateforme de test)
Comprendre Hadoop 2.0 et son écosystème
Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
Le Hadoop Distributed File System (HDFS)
Introduction aux données dans HDFS
MapReduce Framework et YARN
- 2ème partie
Introduction à Pig
Programmation Pig avancée
Troubleshooting et optimisation avec Pig
Résolution des problèmes avec Pig
Utiliser l'UI Web d'Hadoop
Démo optionnelle : résolution d'un Failed Job avec l'UI Web
Echantillonnage de données et débogage
Vue d'ensemble des performances
Comprendre le plan d'exécution
Astuces pour améliorer la performance de vos Pig Jobs
- 3ème partie
Programmation Hive
Utilisation de HCatalog
Programmation Hive avancée
Etendre Hive
Transformation de données avec des Scripts personnalisés
Fonctions définies par l'utilisateur
Paramétrer les requêtes
Exercices Hands
- On : transformation de données avec Hive
Programmation Hive avancée (suite)
Analyse de données et statistiques
- 4ème partie
Import/Export avec Sqoop (SGBDR HDFS)
Sqoop, fonctions avancées
Définition de workflow avec Oozie
- Optionnel : (sous réserve de temps)
Introduction à H
- Base
Exemple d'ingestion de données avec l'ETL Talend
Créer son propre cluster Hadoop (plateforme de test)
Objectifs
Comprendre ce que sont Hadoop et YARN
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
Appréhender MapReduce
Comprendre comment exécuter une tâche de MapReduce sur YARN
Exécuter des modifications en masse avec PIG
Savoir écrire des requêtes pour HIVE afin d'analyser ses données
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
Découverte d'autres briques : automatiser vos process avec Oozie
Utiliser une base de données No
- SQL (HBase)
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
Appréhender MapReduce
Comprendre comment exécuter une tâche de MapReduce sur YARN
Exécuter des modifications en masse avec PIG
Savoir écrire des requêtes pour HIVE afin d'analyser ses données
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
Découverte d'autres briques : automatiser vos process avec Oozie
Utiliser une base de données No
- SQL (HBase)
Centre(s)
- Paris - 5ème (75)
Métier(s)
- Analyste en intelligence économique
- Analyste prix / pricing
- Assistant chargé / Assistante chargée d'études socio-économiques
- Attaché / Attachée d'études statistiques
- Chargé / Chargée d'études commerciales
- Chargé / Chargée d'études de marché
- Chargé / Chargée d'études en marketing
- Chargé / Chargée d'études financières
- Chargé / Chargée d'études prospectives
- Chargé / Chargée d'études satisfaction
- Chargé / Chargée d'études socio-économiques
- Chargé / Chargée d'études statistiques
- Chargé / Chargée d'études économiques
- Chargé / Chargée d'études économiques et sociales
- Chargé / Chargée d'études économiques et statistiques
- Chef de groupe études socio-économiques
- Chef de projet études socio-économiques
- Chef de service études socio-économiques
- Data analyst
- Data miner
- Data scientist
- Directeur / Directrice d'études socio-économiques
- Directeur / Directrice d'études économiques
- Ingénieur / Ingénieure économiste en entreprise
- Ingénieur statisticien / Ingénieure statisticienne
- Responsable d'études socio-économiques
- Responsable d'études économiques
- Responsable de veille stratégique
- Responsable prévision des ventes
- Statisticien / Statisticienne
- Économiste d'entreprise
- Économètre
Compétence(s)
- Algorithmique
- Aménagement du territoire
- Analyse financière
- Analyse statistique
- Big data analytics
- Développement économique
- Gestion budgétaire
- Gestion commerciale, relation clients
- Gestion de projet
- Gestion des Ressources Humaines
- Insights marketing
- Intelligence économique
- Langages de programmation informatique
- Logiciel de conception et analyse d'enquête
- Logiciels de gestion de base de données
- Logiciels de modélisation et simulation
- Logiciels de statistiques
- Management
- Marché de l'emploi
- Marketing / Mercatique
- Modélisation statistique
- Modélisation économique
- Méthodes d'enquête
- Méthodes de prospective
- Outils bureautiques
- Outils de Business Intelligence (BI)
- Sciences économiques et sociales
- Techniques commerciales
- Techniques de benchmarking
- Techniques de conduite d'entretien
- Techniques de mesure d'audience
- Techniques de sondage d'opinions
- Urbanisme
- Économie du développement durable
- Économétrie
Formation proposée par : Data Value
À découvrir