Course Outline
Εισαγωγή στο Apache Spark
- Ο ρόλος του Spark στην επεξεργασία μεγάλων δεδομένων
- Η αρχιτεκτονική του Spark και τα συστατικά του
Ρύθμιση Apache Spark
- Απαιτήσεις υλικού και λογισμικού
- Διαδικασίες εγκατάστασης για αυτόνομες λειτουργίες και λειτουργίες συμπλέγματος
- Βέλτιστες πρακτικές διαμόρφωσης για διαχειριστές συστήματος
Διαχείριση Spark Cluster
- Εργαλεία και τεχνικές διαχείρισης συμπλεγμάτων
- Παρακολούθηση εφαρμογών Spark και πόρων συμπλέγματος
- Διαμορφώσεις ασφαλείας και διαχείριση χρηστών
Συντονισμός απόδοσης και βελτιστοποίηση
- Κατανομή πόρων και προγραμματισμός
- Tuning Spark για βέλτιστη απόδοση
- Εντοπισμός και επίλυση κοινών σημείων συμφόρησης
Αντιμετώπιση προβλημάτων και επίλυση προβλημάτων
- Κοινές προκλήσεις διαχείρισης του Spark
- Διαγνωστικά εργαλεία και τεχνικές για την αντιμετώπιση προβλημάτων
- Βήμα προς βήμα προσέγγιση για την επίλυση κοινών ζητημάτων
- Βέλτιστες πρακτικές για τη διατήρηση ενός υγιούς περιβάλλοντος Spark
Προηγμένα θέματα διαχείρισης
- Ενοποίηση με άλλα εργαλεία μεγάλων δεδομένων
- Εξασφάλιση υψηλής διαθεσιμότητας και αποκατάστασης από καταστροφές
- Αναβάθμιση και κλιμάκωση Spark clusters
Περίληψη και Επόμενα Βήματα
Requirements
- Βασικές γνώσεις διαμόρφωσης και διαχείρισης δικτύου
- Εξοικείωση με το λειτουργικό σύστημα Linux και τη διεπαφή γραμμής εντολών
- Ενδιαφέρον για μάθηση σχετικά με τα κατανεμημένα υπολογιστικά συστήματα και τη διαχείριση μεγάλων δεδομένων
Ακροατήριο
- διαχειριστές συστήματος
Testimonials (8)
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Course - Python and Spark for Big Data (PySpark)
Πολλά πρακτικά παραδείγματα, διαφορετικοί τρόποι προσέγγισης του ίδιου προβλήματος και μερικές φορές όχι τόσο προφανή κόλπα πώς να βελτιώσετε την τρέχουσα λύση
Rafał - Nordea
Course - Apache Spark MLlib
Machine Translated
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Course - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Sufficient hands on, trainer is knowledgable
Chris Tan
Course - A Practical Introduction to Stream Processing
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Course - Big Data Analytics in Health
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Course - Apache Spark in the Cloud
very interactive...
Richard Langford
Course - SMACK Stack for Data Science
Δέσμευση και προθυμία να εξηγηθούν δευτερεύοντα θέματα.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Course - Apache Spark Fundamentals
Machine Translated