Εξέλιξη Κομματιού
Τμήμα 1: Εισαγωγή στο Hadoop
- Ιστορία του Hadoop, εννοιές
- οικογένεια εφαρμογών
- διανομές
- υψηλότερο επίπεδο αρχιτεκτονική
- μύθοι του Hadoop
- προκλήσεις του Hadoop
- υπολογιστικό / λογισμικό
- εργαστήριο : πρώτη ανατροφή από το Hadoop
Τμήμα 2: HDFS
- σχεδιασμός και αρχιτεκτονική
- εννοιές (Οριζόντια επέκταση, αντιγραφή, τοπικότητα δεδομένων, ευαισθητοποίηση πλακάς)
- δαιμόνια : Namenode, Secondary namenode, Data node
- επικοινωνίες / καρδιακές δυσφορίες
- ακεραιότητα δεδομένων
- κέλευση ανάγνωση / γραφή
- Namenode υψηλή διαθεσιμότητα (HA), Ομοσπονδία
- εργαστήρια : Αλληλεπίδραση με το HDFS
Τμήμα 3: Map Reduce
- εννοιές και αρχιτεκτονική
- δαιμόνια (MRV1) : jobtracker / tasktracker
- φάσεις : driver, mapper, shuffle/sort, reducer
- Map Reduce Έκδοση 1 και Έκδοση 2 (YARN)
- Εσωτερικές λεπτομέρειες του Map Reduce
- Εισαγωγή σε Java Map Reduce πρόγραμμα
- εργαστήρια : Εκτέλεση μιας δείγματος προγράμματος MapReduce
Τμήμα 4: Pig
- Pig vs Java Map Reduce
- Rροή εργασίας του Pig
- Γλώσσα Pig Latin
- ETL με το Pig
- Μετασχηματισμοί και Συνδέσεις (Joins)
- Προσαρμόσιμες συναρτήσεις (UDF)
- εργαστήρια : Σύνθεση σεναρίων Pig για την ανάλυση δεδομένων
Τμήμα 5: Hive
- αρχιτεκτονική και σχεδίαση
- τύποι δεδομένων
- Υποστήριξη SQL στο Hive
- Δημιουργία πινάκων Hive και ερωτήματα
- διαχωρισμοί (partitions)
- συνδέσεις (joins)
- επεξεργασία κειμένου
- εργαστήρια : Διάφορα εργαστήρια για την επεξεργασία δεδομένων με το Hive
Τμήμα 6: HBase
- εννοιές και αρχιτεκτονική
- HBase vs RDBMS vs Cassandra
- HBase Java API
- Χρονικά σημεία δεδομένων στο HBase
- σχεδίαση αυτοκλείδων (schema)
- εργαστήρια : Αλληλεπίδραση με το HBase χρησιμοποιώντας κενάκι, προγραμματισμός στη Java API του HBase; Άσκηση σχεδίασης αυτοκλείδων
Απαιτήσεις
- Είστε χαλαροί με τη γλώσσα προγραμματισμού Java (περισσότερα από τα εκπαιδευτικά άσκημα είναι σε Java)
- Είστε χαλαροί με το περιβάλλον Linux (πρέπει να είστε σε θέση να κινηθείτε στη γραμμή εντολών του Linux, να επεξεργάζεστε αρχεία χρησιμοποιώντας vi / nano)
Εργαστήριο περιβάλλον
Zero Install : Δεν χρειάζεται να εγκατασταθεί λογισμικό Hadoop στους υπολογιστές των μαθητών! Θα παρέχεται ένα εργαστήριο Hadoop για τους μαθητές.
Οι μαθητές χρειάζονται τα εξής
- ένα πελάτης SSH (Linux και Mac έχουν ήδη πελάτες ssh, για το Windows συστερείται το Putty)
- ένα πρόγραμμα περιήγησης για να πρόσφερουν πρόσβαση στο εργαστήριο, προτείνεται το Firefox
Σχόλια (5)
Τα ζωντανά παραδείγματα
Ahmet Bolat - Accenture Industrial SS
Κομμάτι - Python, Spark, and Hadoop for Big Data
Μηχανική Μετάφραση
Κατά τη διάρκεια των άσκησης, ο James μου εξήγησε κάθε βήμα όποτε έμενα απόχωρος με περισσότερη λεπτομέρεια. Ήμουν εντελώς νέος στο NIFI. Μου έκανε κατάληψη την πραγματική αξία του NIFI, ακόμη και βασικά συμπτώματα όπως η ανοιχτή πηγή. Εξέφρασε κάθε έννοια του Nifi, ξεκινώντας από το επίπεδο αρχαρίων μέχρι το επίπεδο προγραμματιστών.
Firdous Hashim Ali - MOD A BLOCK
Κομμάτι - Apache NiFi for Administrators
Μηχανική Μετάφραση
Ότι το είχα από την πρώτη στιγμή.
Peter Scales - CACI Ltd
Κομμάτι - Apache NiFi for Developers
Μηχανική Μετάφραση
πρακτικά πράγματα της εφαρμογής, καθώς και η θεωρία που υποστηρίχτηκε καλά από τον Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Κομμάτι - Hadoop Administration on MapR
Μηχανική Μετάφραση
Η Εικαστική Μηχανή (VM) που χαίρομαι πολύ Ο Καθηγητής είχε πολύ γνώσει σχετικά με το θέμα καθώς και με άλλα θέματα, ήταν πολύ όμορφος και φιλικός Η εγκατάσταση στο Δουβάι μου αρέσηκε.
Safar Alqahtani - Elm Information Security
Κομμάτι - Big Data Analytics in Health
Μηχανική Μετάφραση