Εξέλιξη Κομματιού
Εισαγωγή
- Εισαγωγή στο Cloud Computing και τις λύσεις Big Data
- Περίληψη των χαρακτηριστικών και της αρχιτεκτονικής του Apache Hadoop
Ρυθμίζοντας το Hadoop
- Σχεδιάζοντας ένα σύστημα Hadoop (έξω από δικτύο, cloud, κλπ.)
- Επιλέγοντας το λειτουργικό σύστημα και τη διανομή Hadoop
- Παρέχοντας πόρους (σκληρό, δίκτυο, κλπ.)
- Κατεβάζοντας και εγκαθιστώντας το λογισμικό
- Σχεδιάζοντας το σύστημα για αυξημένη ευελιξία
Εργαζόμενοι με HDFS
- Κατανοώντας το Hadoop Distributed File System (HDFS)
- Περίληψη αναφοράς εντολών HDFS
- Εισέρχοντας στο HDFS
- Εκτελώντας βασικές πράξεις αρχείου στο HDFS
- Χρησιμοποιώντας το S3 ως εναλλακτική λύση προς το HDFS
Περίληψη του MapReduce
- Κατανοώντας το ροή δεδομένων στο πλαίσιο MapReduce
- Map, Shuffle, Sort και Reduce
- Δείγμα: Υπολογισμός των υψηλότερων μισθών
Εργαζόμενοι με YARN
- Κατανοώντας τη διαχείριση πόρων στο Hadoop
- Εργαζόμενοι με ResourceManager, NodeManager, Application Master
- Προγραμματισμός εργασιών υπό YARN
- Προγραμματισμός για μεγάλους αριθμούς κόμβων και συστημάτων
- Δείγμα: Προγραμματισμός εργασιών
Ενσωμάτωση του Hadoop με Spark
- Ρυθμίζοντας αποθήκευση για το Spark (HDFS, Amazon S3, NoSQL, κλπ.)
- Κατανοώντας Resilient Distributed Datasets (RDDs)
- Δημιουργία RDD
- Εφαρμογή μετασχηματισμών σε RDD
- Δείγμα: Εφαρμογή προγράμματος αναζήτησης κειμένου για τίτλους ταινιών
Διαχείριση συνόλου Hadoop
- Παρακολούθηση του Hadoop
- Ασφάλιση ενός συνόλου Hadoop
- Προσθήκη και αφαίρεση κόμβων
- Εκτέλεση πειραματικών δοκιμών επιδόσεως
- Προσαρμογή συνόλου Hadoop για βελτίωση της επιδόσεως
- Ανακατασκευή, ανάκτηση και προγραμματισμός συνέχειας επιχείρησης
- Εξασφάλιση υψηλής διαθεσιμότητας (HA)
Αναβάθμιση και μεταφορά συνόλου Hadoop
- Αξιολόγηση απαιτήσεων φόρτου εργασίας
- Αναβάθμιση Hadoop
- Μεταφορά από πλησίο σε cloud και αντίστροφα
- Ανάκτηση από αποτυχίες
Σύγχυση προβλημάτων
Επίκληση και συμπέρασμα
Απαιτήσεις
- Εμπειρία διαχείρισης συστημάτος
- Εμπειρία με την γραμμή εντολών Linux
- Κατανόηση των ιδεών που αφορούν μεγάλα συνόλα δεδομένων
Ακροατήριο
- Διαχετικοί
- DBAs (Διαχετικοί Βάσεων Δεδομένων)
Σχόλια (5)
Τα ζωντανά παραδείγματα
Ahmet Bolat - Accenture Industrial SS
Κομμάτι - Python, Spark, and Hadoop for Big Data
Μηχανική Μετάφραση
εξαιρετικά επικοινωνητικό...
Richard Langford
Κομμάτι - SMACK Stack for Data Science
Μηχανική Μετάφραση
Αρκετή πρακτική εμπειρία, ο καθηγητής είναι γνώστες
Chris Tan
Κομμάτι - A Practical Introduction to Stream Processing
Μηχανική Μετάφραση
Εξάπινα να μάθετε το Spark Streaming, Databricks και AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Κομμάτι - Apache Spark in the Cloud
Μηχανική Μετάφραση
πρακτικές εργασίες
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Κομμάτι - Python and Spark for Big Data (PySpark)
Μηχανική Μετάφραση