Big data avec Apache Spark - initiation par Alphorm
Lieu(x)
À distance
Durée
Total : 8 heures
Financement
Demandeur d’emploi
Salarié
Prix
Nous contacter
Cette formation vous intéresse ?
Description générale
Spark est actuellement le projet open source le plus actif sous la plate
- forme Apache Software Foundation (ASF). Il est aussi l'un des projets open source de big data le plus actif.
Spark permet aux développeurs de créer un traitement de données complexe en plusieurs étapes routines, fournissant une API de haut niveau et un cadre tolérant aux pannes qui permet aux programmeurs à se concentrer sur la logique plutôt que sur les problèmes d'infrastructure ou d'environnement comme une défaillance matérielle par exemple.
Dans cette formation vous allez vous familiariser avec les principes fondamentaux de Spark en utilisant le langage Scala. Spark est écrit en Scala. Il fonctionne en Java virtuel machines (JVM).
Vous allez maitriser l'utilisation MapReduce avec Spark qui est une alternative à l'utilisation traditionnelle MapReduce sur Hadoop.
L'utilisation de MapReduce avec Hadoop a été jugé inadaptée aux requêtes interactives ou temps réel, avec une faible latence applications. Un inconvénient majeur de l'implémentation MapReduce de Hadoop était sa persistance des données intermédiaires sur le disque entre le Map et le Reduce en phases de traitement.
Dans cette formation vous allez apprendre à implémenter une structure distribuée, tolérante aux pannes et in
- memory appelée Resilient Distributed Dataset (RDD). Vous allez également apprendre à traiter les données non structurées.
Dans le chapitre de Spark SQL les notions des DataFrame et DataSet ne seront plus un secret pour vous.
Vous avez surement entendu parler du traitement des données qui arrivent en temps réel, ce qu'on appelle le Streaming. Un chapitre bien détaillé vous attend afin que vous puissiez monter en compétence rapidement avec Spark Streaming.
- forme Apache Software Foundation (ASF). Il est aussi l'un des projets open source de big data le plus actif.
Spark permet aux développeurs de créer un traitement de données complexe en plusieurs étapes routines, fournissant une API de haut niveau et un cadre tolérant aux pannes qui permet aux programmeurs à se concentrer sur la logique plutôt que sur les problèmes d'infrastructure ou d'environnement comme une défaillance matérielle par exemple.
Dans cette formation vous allez vous familiariser avec les principes fondamentaux de Spark en utilisant le langage Scala. Spark est écrit en Scala. Il fonctionne en Java virtuel machines (JVM).
Vous allez maitriser l'utilisation MapReduce avec Spark qui est une alternative à l'utilisation traditionnelle MapReduce sur Hadoop.
L'utilisation de MapReduce avec Hadoop a été jugé inadaptée aux requêtes interactives ou temps réel, avec une faible latence applications. Un inconvénient majeur de l'implémentation MapReduce de Hadoop était sa persistance des données intermédiaires sur le disque entre le Map et le Reduce en phases de traitement.
Dans cette formation vous allez apprendre à implémenter une structure distribuée, tolérante aux pannes et in
- memory appelée Resilient Distributed Dataset (RDD). Vous allez également apprendre à traiter les données non structurées.
Dans le chapitre de Spark SQL les notions des DataFrame et DataSet ne seront plus un secret pour vous.
Vous avez surement entendu parler du traitement des données qui arrivent en temps réel, ce qu'on appelle le Streaming. Un chapitre bien détaillé vous attend afin que vous puissiez monter en compétence rapidement avec Spark Streaming.
Objectifs
Maîtriser les concepts fondamentaux d'Apache Spark
Faire de la programmation parallèle avec Spark et Scala
Exploiter des données avec Spark SQL (utilisation de SQL)
Développer des applications avec Spark Streaming
Faire de la programmation parallèle avec Spark et Scala
Exploiter des données avec Spark SQL (utilisation de SQL)
Développer des applications avec Spark Streaming
Métier(s)
- Architecte fonctionnel / fonctionnelle de système d'information
- Assistant / Assistante maîtrise d'ouvrage des systèmes d'information
- Assistant fonctionnel / Assistante fonctionnelle des systèmes d'information
- Chef de projet Maîtrise d'Ouvrage - MOA des systèmes d'information
- Chef de projet maîtrise d'ouvrage des systèmes d'information
- Chef de projet utilisateurs des systèmes d'information
- Consultant / Consultante ERP - Enterprise Resource Planning
- Consultant / Consultante IT
- Consultant / Consultante SI CRM/GRC Customer Relationship Management - Gestion de la Relation Client
- Consultant / Consultante SI finance comptabilité
- Consultant / Consultante SIRH ressources humaines
- Consultant / Consultante SaaS - Software as a Service
- Consultant / Consultante décisionnel - Business Intelligence
- Consultant / Consultante en accessibilité numérique
- Consultant / Consultante en système d'information
- Consultant / Consultante informatique
- Consultant / Consultante réseaux informatiques
- Consultant fonctionnel / Consultante fonctionnelle de progiciel
- Consultant fonctionnel / Consultante fonctionnelle des systèmes d'information
- Coordinateur / Coordinatrice de la Maîtrise d'ouvrage des systèmes d'information
- Coordinateur / Coordinatrice projet en Maîtrise d'Ouvrage (MOA)
- Expert / Experte métier système d'information
- Gestionnaire d'applications système d'information
- Maître / Maîtresse d'ouvrage système d'information
- Product Owner
- Responsable de projets « métiers » système d'information
- Responsable utilisateurs des systèmes d'information
- Urbaniste des systèmes d'information
Compétence(s)
- Animation d'instances agiles (mêlée, démonstration, rétrospective, …)
- Architecture des systèmes d'information
- Architecture réseau
- Audit interne
- Code des marchés publics
- Comptabilité générale
- Droit commercial
- Droit de la propriété intellectuelle
- Externalisation des systèmes d'information
- Finance
- Gestion commerciale, relation clients
- Gestion de production
- Gestion de projet
- Gestion des Ressources Humaines
- Gestion financière
- Infogérance / télémaintenance
- Marketing / Mercatique
- Modélisation informatique
- Méthode AGILE
- Méthodes d'analyse (systémique, fonctionnelle, de risques, ...)
- Méthodologie SAFe
- Méthodologie Scrum
- Outils de planification des ressources humaines
- Process et procédures d'achats
- Procédures d'appels d'offres
- Procédures d'élaboration d'un plan de tests (étapes, scénarii...)
- Progiciels de Gestion Intégrée (PGI) / Enterprise Resource Planning (ERP)
- Progiciels industriels et techniques
- Progiciels spécifiques à la logistique
- Règlement Général européen sur la Protection des Données (RGPD)
- Règles de sécurité Informatique et Télécoms
- Réseaux informatiques et télécoms
- Techniques commerciales
- Technologie de l'internet
- Technologies de l'accessibilité numérique
Formation proposée par : Alphorm
À découvrir