Informations sur la formation

  • Categorie: PréQualif Pro BIG DATA
  • Client: Toutes personnes ayant des notions en informatique
  • Durée: Sous traitement du dossier du candidat
  • Certification: Oui, après la réussite à l'examen 2IPBD, un certificat authentifié et acrédité sera délivré en fin de formation



La Big Data qu'est-ce-que c'est ?

Le concept de Big Data est apparu pour faire face à l’augmentation croissante du nombre de données. Aujourd’hui en effet, les volumes de données sont très conséquents et il est impératif de trouver des solutions de stockage et d’analyse adéquates. Le Gartner donne une vue très mnémotechnique du concept du Big Data, qui répond à la problématique des 3V : volumes de données, variété des données (multi-source) et vélocité en termes de collecte des données, stockage et analyse. Et qui dit apparition d’un nouveau concept dit aussi création de nouvelles technologies. Ce sont les mastodontes du web comme Google, Yahoo ou Facebook qui ont été à l’origine de la création de ces nouveaux outils.

A quoi sert le Big Data ?

Aujourd’hui, les applications du Big Data se sont largement développées pour répondre aux besoins évoqués ci-dessus. Naturellement, vous vous demandez « le Big Data c’est pour faire quoi ? » Et bien c’est simple, aujourd‘hui il permet de répondre à plusieurs problématiques comme l’analyse prédictive et plus particulièrement dans le cadre de maintenance préventive ou encore de prédiction des ventes et gestion des stocks. L’analyse des données en temps réel est aussi une des applications du Big Data. Il existe donc plusieurs technologies Big Data répondant à ces besoins.

Apache Hadoop

La première et la plus répandue des solutions est bien évidemment Apache Hadoop, un framework largement utilisé aujourd’hui pour traiter de très gros volumes de données. Hadoop est composé de plusieurs éléments : un système de stockage (HDFS), un système de planification des traitements (YARN) et le framework de traitement (MapReduce). Un des cas d’utilisation les plus connus de Hadoop est le data lake. ...