Εξέλιξη Κομματιού

Εισαγωγή

  • Εισαγωγή στο Cloud Computing και τις λύσεις Big Data
  • Περίληψη των χαρακτηριστικών και της αρχιτεκτονικής του Apache Hadoop

Ρυθμίζοντας το Hadoop

  • Σχεδιάζοντας ένα σύστημα Hadoop (έξω από δικτύο, cloud, κλπ.)
  • Επιλέγοντας το λειτουργικό σύστημα και τη διανομή Hadoop
  • Παρέχοντας πόρους (σκληρό, δίκτυο, κλπ.)
  • Κατεβάζοντας και εγκαθιστώντας το λογισμικό
  • Σχεδιάζοντας το σύστημα για αυξημένη ευελιξία

Εργαζόμενοι με HDFS

  • Κατανοώντας το Hadoop Distributed File System (HDFS)
  • Περίληψη αναφοράς εντολών HDFS
  • Εισέρχοντας στο HDFS
  • Εκτελώντας βασικές πράξεις αρχείου στο HDFS
  • Χρησιμοποιώντας το S3 ως εναλλακτική λύση προς το HDFS

Περίληψη του MapReduce

  • Κατανοώντας το ροή δεδομένων στο πλαίσιο MapReduce
  • Map, Shuffle, Sort και Reduce
  • Δείγμα: Υπολογισμός των υψηλότερων μισθών

Εργαζόμενοι με YARN

  • Κατανοώντας τη διαχείριση πόρων στο Hadoop
  • Εργαζόμενοι με ResourceManager, NodeManager, Application Master
  • Προγραμματισμός εργασιών υπό YARN
  • Προγραμματισμός για μεγάλους αριθμούς κόμβων και συστημάτων
  • Δείγμα: Προγραμματισμός εργασιών

Ενσωμάτωση του Hadoop με Spark

  • Ρυθμίζοντας αποθήκευση για το Spark (HDFS, Amazon S3, NoSQL, κλπ.)
  • Κατανοώντας Resilient Distributed Datasets (RDDs)
  • Δημιουργία RDD
  • Εφαρμογή μετασχηματισμών σε RDD
  • Δείγμα: Εφαρμογή προγράμματος αναζήτησης κειμένου για τίτλους ταινιών

Διαχείριση συνόλου Hadoop

  • Παρακολούθηση του Hadoop
  • Ασφάλιση ενός συνόλου Hadoop
  • Προσθήκη και αφαίρεση κόμβων
  • Εκτέλεση πειραματικών δοκιμών επιδόσεως
  • Προσαρμογή συνόλου Hadoop για βελτίωση της επιδόσεως
  • Ανακατασκευή, ανάκτηση και προγραμματισμός συνέχειας επιχείρησης
  • Εξασφάλιση υψηλής διαθεσιμότητας (HA)

Αναβάθμιση και μεταφορά συνόλου Hadoop

  • Αξιολόγηση απαιτήσεων φόρτου εργασίας
  • Αναβάθμιση Hadoop
  • Μεταφορά από πλησίο σε cloud και αντίστροφα
  • Ανάκτηση από αποτυχίες

Σύγχυση προβλημάτων

Επίκληση και συμπέρασμα

Απαιτήσεις

  • Εμπειρία διαχείρισης συστημάτος
  • Εμπειρία με την γραμμή εντολών Linux
  • Κατανόηση των ιδεών που αφορούν μεγάλα συνόλα δεδομένων

Ακροατήριο

  • Διαχετικοί
  • DBAs (Διαχετικοί Βάσεων Δεδομένων)
 35 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (5)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες