Course Outline

Επισκόπηση μεγάλων δεδομένων:

    Τι είναι το Big Data Γιατί το Big Data κερδίζει δημοτικότητα Big Data Μελέτες περιπτώσεων Big Data Χαρακτηριστικά Λύσεις για εργασία Big Data.

Hadoop & τα συστατικά του:

    Τι είναι το Hadoop και ποια είναι τα συστατικά του. Hadoop Η Αρχιτεκτονική και τα χαρακτηριστικά της Δεδομένα που μπορεί να χειριστεί /Διαδικασία. Σύντομη για το Hadoop Ιστορικό, οι εταιρείες που το χρησιμοποιούν και γιατί άρχισαν να το χρησιμοποιούν. Hadoop Πλαίσιο και τα εξαρτήματά του- εξηγούνται λεπτομερώς. Τι είναι το HDFS και Reads -Writes to Hadoop Distributed File System. Πώς να ρυθμίσετε το Hadoop Cluster σε διαφορετικούς τρόπους λειτουργίας - Stand- Only/Pseudo/Multi Node cluster.

(Αυτό περιλαμβάνει τη ρύθμιση ενός συμπλέγματος Hadoop στο VirtualBox/KVM/VMware, διαμορφώσεις δικτύου που πρέπει να εξεταστούν προσεκτικά, εκτέλεση Hadoop Daemons και δοκιμή του συμπλέγματος).

    Τι είναι το Map Reduce frame work και πώς λειτουργεί. Εκτέλεση χάρτη Μειώστε τις εργασίες στο σύμπλεγμα Hadoop. Κατανόηση της επίγνωσης του Replication , του Mirroring και του Rack στο πλαίσιο Hadoop clusters.

Hadoop Σχεδιασμός συμπλέγματος:

    Πώς να σχεδιάσετε το σύμπλεγμα hadoop σας. Κατανόηση υλικού-λογισμικού για το σχεδιασμό του συστάδας hadoop. Κατανόηση του φόρτου εργασίας και σχεδιασμού συμπλέγματος για την αποφυγή αστοχιών και τη βέλτιστη απόδοση.

Τι είναι το MapR και γιατί το MapR:

    Επισκόπηση του MapR και της αρχιτεκτονικής του. Κατανόηση και λειτουργία του Συστήματος Ελέγχου MapR, των τόμων MapR, των στιγμιότυπων & των κατόπτρων. Σχεδιασμός ενός cluster στο πλαίσιο του MapR. Σύγκριση του MapR με άλλες διανομές και Apache Hadoop. Εγκατάσταση MapR και ανάπτυξη συμπλέγματος.

Ρύθμιση και διαχείριση συμπλέγματος:

    Διαχείριση υπηρεσιών, κόμβων, στιγμιότυπων, τόμων κατοπτρισμού και απομακρυσμένων συμπλεγμάτων. Κατανόηση και διαχείριση κόμβων. Κατανόηση των Hadoop στοιχείων, Εγκατάσταση Hadoop στοιχείων παράλληλα με τις Υπηρεσίες MapR. Πρόσβαση σε δεδομένα στο σύμπλεγμα, συμπεριλαμβανομένης της διαχείρισης υπηρεσιών και κόμβων NFS. Διαχείριση δεδομένων με χρήση τόμων, διαχείριση χρηστών και ομάδων, διαχείριση και ανάθεση ρόλων σε κόμβους, θέση σε λειτουργία παροπλισμού κόμβων, διαχείριση συμπλεγμάτων και παρακολούθηση απόδοσης, διαμόρφωση/ανάλυση και παρακολούθηση μετρήσεων για την παρακολούθηση της απόδοσης, διαμόρφωση και διαχείριση της ασφάλειας MapR. Κατανόηση και εργασία με το M7- Native storage για πίνακες MapR. Διαμόρφωση και ρύθμιση συμπλέγματος για βέλτιστη απόδοση.

Αναβάθμιση και ενοποίηση συμπλέγματος με άλλες ρυθμίσεις:

    Αναβάθμιση έκδοσης λογισμικού του MapR και τύποι αναβάθμισης. Διαμόρφωση του συμπλέγματος Mapr για πρόσβαση στο σύμπλεγμα HDFS. Ρύθμιση του συμπλέγματος MapR στο Amazon Elastic Mapreduce.

Όλα τα παραπάνω θέματα περιλαμβάνουν επιδείξεις και συνεδρίες εξάσκησης για να αποκτήσουν οι εκπαιδευόμενοι πρακτική εμπειρία από την τεχνολογία.

Requirements

  • Βασικές γνώσεις Linux FS
  • Βασική Java
  • Γνώση Apache Hadoop (προτείνεται)
  28 Hours
 

Number of participants


Starts

Ends


Dates are subject to availability and take place between 09:30 and 16:30.
Open Training Courses require 5+ participants.

Testimonials (1)

Related Courses

Apache Ambari: Efficiently Manage Hadoop Clusters

  21 Hours

Hadoop For Administrators

  21 Hours

Hadoop for Project Managers

  14 Hours

Samza for Stream Processing

  14 Hours

Datameer for Data Analysts

  14 Hours

Related Categories