Course Outline

Εισαγωγή στο Google Colab και Apache Spark

  • Επισκόπηση του Google Colab
  • Εισαγωγή στο Apache Spark
  • Ρύθμιση του Spark στο Google Colab

Επεξεργασία δεδομένων με Apache Spark

  • Εργασία με RDD και DataFrames
  • Φόρτωση και επεξεργασία μεγάλων συνόλων δεδομένων
  • Χρήση του Spark SQL για την αναζήτηση δομημένων δεδομένων

Προηγμένο Analytics με Spark

  • Μηχανική εκμάθηση με το Spark MLlib
  • Πραγματοποίηση ανάλυσης δεδομένων σε πραγματικό χρόνο
  • Κατανεμημένος υπολογισμός με Spark

Οπτικοποίηση και Collaboration στο Google Colab

  • Ενσωμάτωση του Colab με δημοφιλείς βιβλιοθήκες οπτικοποίησης
  • Συνεργατικές ροές εργασιών με σημειωματάρια Colab
  • Κοινή χρήση και εξαγωγή αποτελεσμάτων

Βελτιστοποίηση Big Data ροών εργασίας

  • Tuning Spark για απόδοση
  • Βελτιστοποίηση της χρήσης μνήμης και αποθήκευσης
  • Κλιμάκωση ροών εργασιών για μεγάλα σύνολα δεδομένων

Big Data στο Cloud

  • Ενσωμάτωση του Google Colab με εργαλεία που βασίζονται στο cloud
  • Χρήση αποθήκευσης cloud για μεγάλα δεδομένα
  • Εργασία με το Spark σε περιβάλλοντα κατανεμημένου cloud

Μελέτες περίπτωσης και βέλτιστες πρακτικές

  • Ανασκόπηση εφαρμογών μεγάλων δεδομένων πραγματικού κόσμου
  • Μελέτες περίπτωσης με χρήση Apache Spark και Colab
  • Βέλτιστες πρακτικές για ανάλυση μεγάλων δεδομένων

Περίληψη και Επόμενα Βήματα

Requirements

  • Βασικές γνώσεις των εννοιών της επιστήμης δεδομένων
  • Εξοικείωση με το Apache Spark
  • Python δεξιότητες προγραμματισμού

Ακροατήριο

  • Επιστήμονες δεδομένων
  • Μηχανικοί δεδομένων
  • Ερευνητές που εργάζονται με μεγάλα δεδομένα
 14 Hours

Number of participants


Price per participant

Testimonials (5)

Upcoming Courses

Related Categories