Εξέλιξη Κομματιού

Τμήμα 1: Διαχείριση δεδομένων στο HDFS

  • Διάφορα μορφών δεδομένων (JSON / Avro / Parquet)
  • Συστήματα πιεζοπληξίας
  • Προστασία δεδομένων
  • Εργαστήρια : Ανάλυση διαφορετικών μορφών δεδομένων; ενεργοποίηση πιεζοπληξίας

Τμήμα 2: Προηγμένο Pig

  • Ορισμός συναρτήσεων από το χρήστη
  • Εισαγωγή σε βιβλιοθήκες Pig (ElephantBird / Data-Fu)
  • Φορτώματος περίπλοκων δομημένων δεδομένων με το Pig
  • Εξατομικοποίηση Pig
  • Εργαστήρια : προηγμένο scripting σε Pig, ανάλυση περίπλοκων τύπων δεδομένων

Τμήμα 3: Προηγμένο Hive

  • Ορισμός συναρτήσεων από το χρήστη
  • Συμπιεζόμενες πίνακες
  • Εξατομικοποίηση στο Hive
  • Εργαστήρια : δημιουργία συμπιεζόμενων πινάκων, εξέταση μορφών και ρύθμιση πινάκων

Τμήμα 4: Προηγμένο HBase

  • Προηγμένες πρότυπα σχεδιασμού σεμαντικής δομής
  • Συμπίεση
  • Μαζική εισαγωγή δεδομένων
  • Σύγκριση πλατών και μακρύν πινάκων
  • HBase και Pig
  • HBase και Hive
  • Εξατομικοποίηση στο HBase
  • Εργαστήρια : εξατομικοποίηση του HBase, πρόσβαση δεδομένων HBase από Pig και Hive; Χρήση Phoenix για σχεδιασμό δεδομένων

Απαιτήσεις

  • Έχουν περάσει τη γλώσσα Java (τα περισσότερα από τα άσκημα προγραμματισμού είναι σε Java)
  • Έχουν κάποιες βασικές γνώσεις του περιβάλλοντος Linux (μπορούν να μεταβιβάζονται στη γραμμή εντολών του Linux, να επεξεργάζονται αρχεία χρησιμοποιώντας vi / nano)
  • Έχουν μια εργαστική γνώση του Hadoop.

Εργαστικό περιβάλλον

Μη χρειάζεται εγκατάσταση: Δεν απαιτείται η εγκατάσταση λογισμικού Hadoop στα υπολογιστή των φοιτητών! Ένα λειτουργικό cluster hadoop θα παρέχεται για τους φοιτητές.

Οι φοιτητές θα χρειάζονται το εξής

 21 Ώρες

Αριθμός συμμετέχοντων


Τιμή ανά συμμετοχαστή

Σχόλια (5)

Εφεξής Μαθήματα

Σχετικές Κατηγορίες