Course Outline
Εισαγωγή στο Google Colab και Apache Spark
- Επισκόπηση του Google Colab
- Εισαγωγή στο Apache Spark
- Ρύθμιση του Spark στο Google Colab
Επεξεργασία δεδομένων με Apache Spark
- Εργασία με RDD και DataFrames
- Φόρτωση και επεξεργασία μεγάλων συνόλων δεδομένων
- Χρήση του Spark SQL για την αναζήτηση δομημένων δεδομένων
Προηγμένο Analytics με Spark
- Μηχανική εκμάθηση με το Spark MLlib
- Πραγματοποίηση ανάλυσης δεδομένων σε πραγματικό χρόνο
- Κατανεμημένος υπολογισμός με Spark
Οπτικοποίηση και Collaboration στο Google Colab
- Ενσωμάτωση του Colab με δημοφιλείς βιβλιοθήκες οπτικοποίησης
- Συνεργατικές ροές εργασιών με σημειωματάρια Colab
- Κοινή χρήση και εξαγωγή αποτελεσμάτων
Βελτιστοποίηση Big Data ροών εργασίας
- Tuning Spark για απόδοση
- Βελτιστοποίηση της χρήσης μνήμης και αποθήκευσης
- Κλιμάκωση ροών εργασιών για μεγάλα σύνολα δεδομένων
Big Data στο Cloud
- Ενσωμάτωση του Google Colab με εργαλεία που βασίζονται στο cloud
- Χρήση αποθήκευσης cloud για μεγάλα δεδομένα
- Εργασία με το Spark σε περιβάλλοντα κατανεμημένου cloud
Μελέτες περίπτωσης και βέλτιστες πρακτικές
- Ανασκόπηση εφαρμογών μεγάλων δεδομένων πραγματικού κόσμου
- Μελέτες περίπτωσης με χρήση Apache Spark και Colab
- Βέλτιστες πρακτικές για ανάλυση μεγάλων δεδομένων
Περίληψη και Επόμενα Βήματα
Requirements
- Βασικές γνώσεις των εννοιών της επιστήμης δεδομένων
- Εξοικείωση με το Apache Spark
- Python δεξιότητες προγραμματισμού
Ακροατήριο
- Επιστήμονες δεδομένων
- Μηχανικοί δεδομένων
- Ερευνητές που εργάζονται με μεγάλα δεδομένα
Testimonials (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Course - ArcGIS Fundamentals
Εργαστηριακή άσκηση
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Course - Automated Monitoring with Zabbix
Machine Translated
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Course - QGIS for Geographic Information System
Μου άρεσε το στυλ του Pablo, το γεγονός ότι κάλυψε πολλά θέματα από το σχεδιασμό αναφορών, την προσαρμογή με html έως την εφαρμογή απλών αλγορίθμων ML. Goισορροπία θεωρητικών πληροφοριών / ασκήσεων. Ο Pablo κάλυψε πραγματικά όλα τα θέματα που με ενδιέφεραν και έδωσε ολοκληρωμένες απαντήσεις στις ερωτήσεις μου.
Cristian Tudose - SC Automobile Dacia SA
Course - Advanced Data Analysis with TIBCO Spotfire
Machine Translated
Actual application of spotfire and all basic functions.