Εξέλιξη Κομματιού
-
Συνοψιστική παρουσίαση Scala
- Γρήγορη εισαγωγή στο Scala
- Εργαστήρια : Εξερεύνηση του Scala
-
Βασικά στο Spark
- Ιστορία και υπόβαθρο
- O Spark και το Hadoop
- Εννοιές και αρχitecture του Spark
- To οικοσύστημα του Spark (core, spark sql, mlib, streaming)
- Εργαστήρια : Εγκατάσταση και εκτέλεση του Spark
-
Πρώτη ματιά στο Spark
- Εκτέλεση του Spark σε τοπικό rezhim
- To web UI του Spark
- To ενεργό σκέλος του Spark
- Ανάλυση dataset – μέρος 1
- Έλεγχος RDDs
- Εργαστήρια: Εξερεύνηση του ενεργού σκέλους του Spark
-
RDDs
- Εννοιές RDDs
- Μερίδες (Partitions)
- Συγκεκριμένες επιχειρήσεις / μετασχηματισμοί RDDs
- Τύποι RDDs
- RDDs ζευγάρων κλειδιών-τιμών (Key-Value pairs)
- MapReduce σε RDDs
- Αποθήκευση και παραμονή
- Εργαστήρια : Δημιουργία και εξέταση RDDs; Αποθήκευση RDDs
-
Προγραμματισμός API του Spark
- Εισαγωγή στην API του Spark / RDD API
- Υποβολή πρώτου προγράμματος στο Spark
- Debugging / logging
- Ιδιότητες ρύθμισης
- Εργαστήρια : Προγραμματισμός στην API του Spark, Υποβολή jobs
-
Spark SQL
- Υποστήριξη SQL στο Spark
- Dataframes
- Ορισμός πινάκων και εισαγωγή dataset
- Ερώτηση data frames χρησιμοποιώντας SQL
- Η μορφές αποθήκευσης : JSON / Parquet
- Εργαστήρια : Δημιουργία και ερωτήσεις data frames; Αξιολόγηση μορφών δεδομένων
-
MLlib
- Εισαγωγή στο MLlib
- Αλγόριθμοι MLlib
- Εργαστήρια : Σύνταξη εφαρμογών MLib
-
GraphX
- Περιγραφή της βιβλιοθήκης GraphX
- APIs GraphX
- Εργαστήρια : Επεξεργασία δεδομένων γράφων χρησιμοποιώντας το Spark
-
Spark Streaming
- Εξαμηνιακή υποστήριξη ρύθμισης χρόνου
- Αξιολόγηση πλατφόρμων ρύθμισης χρόνου
- Επιχειρήσεις ρύθμισης χρόνου
- Επιχειρήσεις sliding window
- Εργαστήρια : Σύνταξη εφαρμογών ρύθμισης χρόνου στο Spark
-
Spark και Hadoop
- Εισαγωγή στο Hadoop (HDFS / YARN)
- Hadoop + Spark architecture
- Εκτέλεση του Spark στο Hadoop YARN
- Επεξεργασία αρχείων HDFS χρησιμοποιώντας το Spark
-
Απόδοση και ρύθμιση του Spark
- Broadcast variables
- Accumulators
- Διαχείριση μνήμης και αποθήκευση
-
Εφαρμογές του Spark
- Παρακατάθεση του Spark σε παραγωγικό περιβάλλον
- Υποδείγματα προτυπών παρακατάθεσης
- Ρυθμίσεις
- Παρακολούθηση
- Επίλυση προβλημάτων
Απαιτήσεις
Υποχρεώνοντα προηγούμενα γνώσματα:
γνώση της Java / Scala / Python (τα εργαστήρια μας στα Scala και Python)
βασική κατανόηση του περιβάλλοντος ανάπτυξης Linux (ναυτική μέσω γραμμής εντολών / επεξεργασία αρχείων χρησιμοποιώντας το VI ή nano)
Σχόλια (6)
Εξάσκηση σε παρόμοια ασκήσεις με διαφορετικούς τρόπους βοηθά πραγματικά να καταλάβεις ποιες είναι οι δυνατότητες κάθε συστήματος (Hadoop/Spark, μονούς/κλάουστρο) ξεχωριστά και μαζί. Μου δώσει ιδέες για το πώς θα πρέπει να ελέγχω την εφαρμογή μου στον τοπικό υπολογιστή κατά την ανάπτυξη της, έναντι του όταν είναι εγκατεστραμένη σε έναν κλάουστρο.
Thomas Carcaud - IT Frankfurt GmbH
Κομμάτι - Spark for Developers
Μηχανική Μετάφραση
Αιάγκ ήταν εξαιρετικά φίλος, βοηθητικός και επίσης γνωστός στο θέμα που συζητούσε.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Κομμάτι - Spark for Developers
Μηχανική Μετάφραση
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Κομμάτι - Spark for Developers
Μηχανική Μετάφραση
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Κομμάτι - Spark for Developers
Μηχανική Μετάφραση
We know a lot more about the whole environment.
John Kidd
Κομμάτι - Spark for Developers
Μηχανική Μετάφραση
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Kieran Mac Kenna
Κομμάτι - Spark for Developers
Μηχανική Μετάφραση