Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Εισαγωγή:
- Το Apache Spark στο Hadoop Ecosystem Σύντομη εισαγωγή για python, scala
Βασικά στοιχεία (θεωρία):
- Αρχιτεκτονική RDD Transformation and Actions Stage, Task, Dependencies
Χρησιμοποιώντας το περιβάλλον Databricks κατανοήστε τα βασικά (πρακτικό εργαστήριο):
- Ασκήσεις με χρήση RDD API Βασικές συναρτήσεις ενεργειών και μετασχηματισμού PairRDD Συμμετοχή σε στρατηγικές αποθήκευσης στην κρυφή μνήμη Ασκήσεις με χρήση DataFrame API SparkSQL DataFrame: επιλογή, φίλτρο, ομάδα, ταξινόμηση UDF (συνάρτηση καθορισμένη από το χρήστη) Εξέταση ροής API DataSet
Χρησιμοποιώντας το περιβάλλον AWS κατανοήστε την ανάπτυξη (πρακτικό εργαστήριο):
- Βασικά στοιχεία του AWS Glue Κατανόηση των διαφορών μεταξύ AWS EMR και AWS Glue Παράδειγμα εργασιών και στα δύο περιβάλλοντα Κατανόηση πλεονεκτημάτων και μειονεκτημάτων
Επιπλέον:
- Εισαγωγή στην ενορχήστρωση Apache Airflow
Requirements
Ικανότητες προγραμματισμού (κατά προτίμηση python, scala)
SQL βασικά
21 Hours
Testimonials (3)
Συνομιλία με την πράξη / εργασίες
Poornima Chenthamarakshan - Intelligent Medical Objects
Course - Apache Spark in the Cloud
Machine Translated
1. Σωστό ισοζύγιο μεταξύ υψηλοβάθμων κυρίων έννοιων και τεχνικών λεπτομερειών. 2. Ο Andras είναι πολύ γνωστός στα θέματα που διδάσκει. 3. Ασκήση
Steven Wu - Intelligent Medical Objects
Course - Apache Spark in the Cloud
Machine Translated
Εξάπινα να μάθετε το Spark Streaming, Databricks και AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Course - Apache Spark in the Cloud
Machine Translated