Εξέλιξη Κομματιού

Τμήμα 1: Εισαγωγή στο Hadoop

  • Ιστορία του Hadoop, εννοιές
  • οικογένεια εφαρμογών
  • διανομές
  • υψηλότερο επίπεδο αρχιτεκτονική
  • μύθοι του Hadoop
  • προκλήσεις του Hadoop
  • υπολογιστικό / λογισμικό
  • εργαστήριο : πρώτη ανατροφή από το Hadoop

Τμήμα 2: HDFS

  • σχεδιασμός και αρχιτεκτονική
  • εννοιές (Οριζόντια επέκταση, αντιγραφή, τοπικότητα δεδομένων, ευαισθητοποίηση πλακάς)
  • δαιμόνια : Namenode, Secondary namenode, Data node
  • επικοινωνίες / καρδιακές δυσφορίες
  • ακεραιότητα δεδομένων
  • κέλευση ανάγνωση / γραφή
  • Namenode υψηλή διαθεσιμότητα (HA), Ομοσπονδία
  • εργαστήρια : Αλληλεπίδραση με το HDFS

Τμήμα 3: Map Reduce

  • εννοιές και αρχιτεκτονική
  • δαιμόνια (MRV1) : jobtracker / tasktracker
  • φάσεις : driver, mapper, shuffle/sort, reducer
  • Map Reduce Έκδοση 1 και Έκδοση 2 (YARN)
  • Εσωτερικές λεπτομέρειες του Map Reduce
  • Εισαγωγή σε Java Map Reduce πρόγραμμα
  • εργαστήρια : Εκτέλεση μιας δείγματος προγράμματος MapReduce

Τμήμα 4: Pig

  • Pig vs Java Map Reduce
  • Rροή εργασίας του Pig
  • Γλώσσα Pig Latin
  • ETL με το Pig
  • Μετασχηματισμοί και Συνδέσεις (Joins)
  • Προσαρμόσιμες συναρτήσεις (UDF)
  • εργαστήρια : Σύνθεση σεναρίων Pig για την ανάλυση δεδομένων

Τμήμα 5: Hive

  • αρχιτεκτονική και σχεδίαση
  • τύποι δεδομένων
  • Υποστήριξη SQL στο Hive
  • Δημιουργία πινάκων Hive και ερωτήματα
  • διαχωρισμοί (partitions)
  • συνδέσεις (joins)
  • επεξεργασία κειμένου
  • εργαστήρια : Διάφορα εργαστήρια για την επεξεργασία δεδομένων με το Hive

Τμήμα 6: HBase

  • εννοιές και αρχιτεκτονική
  • HBase vs RDBMS vs Cassandra
  • HBase Java API
  • Χρονικά σημεία δεδομένων στο HBase
  • σχεδίαση αυτοκλείδων (schema)
  • εργαστήρια : Αλληλεπίδραση με το HBase χρησιμοποιώντας κενάκι, προγραμματισμός στη Java API του HBase; Άσκηση σχεδίασης αυτοκλείδων

Απαιτήσεις

  • Είστε χαλαροί με τη γλώσσα προγραμματισμού Java (περισσότερα από τα εκπαιδευτικά άσκημα είναι σε Java)
  • Είστε χαλαροί με το περιβάλλον Linux (πρέπει να είστε σε θέση να κινηθείτε στη γραμμή εντολών του Linux, να επεξεργάζεστε αρχεία χρησιμοποιώντας vi / nano)

Εργαστήριο περιβάλλον

Zero Install : Δεν χρειάζεται να εγκατασταθεί λογισμικό Hadoop στους υπολογιστές των μαθητών! Θα παρέχεται ένα εργαστήριο Hadoop για τους μαθητές.

Οι μαθητές χρειάζονται τα εξής

  • ένα πελάτης SSH (Linux και Mac έχουν ήδη πελάτες ssh, για το Windows συστερείται το Putty)
  • ένα πρόγραμμα περιήγησης για να πρόσφερουν πρόσβαση στο εργαστήριο, προτείνεται το Firefox
 28 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (5)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες