Analyse de données en environnement Hadoop par Data Value

Lieu(x)
En centre (75)
Durée
Total : 21 heures
En centre : 21 heures
Financement
Demandeur d’emploi
Salarié
Prix
Nous contacter
Cette formation vous intéresse ?
Description générale
- 1ère partie
Comprendre Hadoop 2.0 et son écosystème
Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
Le Hadoop Distributed File System (HDFS)
Introduction aux données dans HDFS
MapReduce Framework et YARN
- 2ème partie
Introduction à Pig
Programmation Pig avancée
Troubleshooting et optimisation avec Pig
Résolution des problèmes avec Pig
Utiliser l'UI Web d'Hadoop
Démo optionnelle : résolution d'un Failed Job avec l'UI Web
Echantillonnage de données et débogage
Vue d'ensemble des performances
Comprendre le plan d'exécution
Astuces pour améliorer la performance de vos Pig Jobs
- 3ème partie
Programmation Hive
Utilisation de HCatalog
Programmation Hive avancée
Etendre Hive
Transformation de données avec des Scripts personnalisés
Fonctions définies par l'utilisateur
Paramétrer les requêtes
Exercices Hands
- On : transformation de données avec Hive
Programmation Hive avancée (suite)
Analyse de données et statistiques
- 4ème partie
Import/Export avec Sqoop (SGBDR HDFS)
Sqoop, fonctions avancées
Définition de workflow avec Oozie
- Optionnel : (sous réserve de temps)
Introduction à H
- Base
Exemple d'ingestion de données avec l'ETL Talend
Créer son propre cluster Hadoop (plateforme de test)
Objectifs
Comprendre ce que sont Hadoop et YARN
Connaître les différents outils et les Framework dans un environnement Hadoop 2.0
Appréhender MapReduce
Comprendre comment exécuter une tâche de MapReduce sur YARN
Exécuter des modifications en masse avec PIG
Savoir écrire des requêtes pour HIVE afin d'analyser ses données
Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
Découverte d'autres briques : automatiser vos process avec Oozie
Utiliser une base de données No
- SQL (HBase)
Centre(s)
  • Paris - 5ème (75)
Formation proposée par : Data Value
À découvrir
BIG DATA : Récolte et analyse de données volumineuses Hadoop (à distance) (?á distance) par Cegefos
Service Formation Continue de l'Université de Montpellier
Licence Professionnelle Protection de l'Environnement Analyse Chimique appliquée à l'Environnement (ACAE) à Montpellier par Service Formation Continue de l'Université de Montpellier
Analyse statistique de données avec le langage R par ThinkR
Analyser les données avec Microsoft Power BI par Groupe Arkesys - Avanteam Formation
Analyse et conception de bases de données relationnelles par Sirieix Conseil
DataViz - Visualisation et analyse de données avec Excel par Groupe Arkesys
Excel - Perfectionnement - Exploiter, analyser et présenter des données par M2I FORMATION MERIGNAC
CU Analyses de données par Université de Lille
Excel - analyse de données par CCM Benchmark Group
Statistique et analyse de données par Stat4decision